diff --git a/docling/models/layout_model.py b/docling/models/layout_model.py
index f9127307..b06c5adf 100644
--- a/docling/models/layout_model.py
+++ b/docling/models/layout_model.py
@@ -102,12 +102,7 @@ class LayoutModel(BasePageModel):
)
def draw_clusters_and_cells_side_by_side(
- self,
- conv_res,
- page,
- clusters,
- mode_prefix: str,
- show: bool = False,
+ self, conv_res, page, clusters, mode_prefix: str, show: bool = False
):
"""
Draws a page image side by side with clusters filtered into two categories:
@@ -115,9 +110,9 @@ class LayoutModel(BasePageModel):
- Right: Clusters including FORM, KEY_VALUE_REGION, and PICTURE.
Includes label names and confidence scores for each cluster.
"""
- page_image = deepcopy(page.image)
- scale_x = page_image.width / page.size.width
- scale_y = page_image.height / page.size.height
+ scale_x = page.image.width / page.size.width
+ scale_y = page.image.height / page.size.height
+
# Filter clusters for left and right images
exclude_labels = {
DocItemLabel.FORM,
@@ -127,8 +122,8 @@ class LayoutModel(BasePageModel):
left_clusters = [c for c in clusters if c.label not in exclude_labels]
right_clusters = [c for c in clusters if c.label in exclude_labels]
# Create a deep copy of the original image for both sides
- left_image = page_image
- right_image = copy.deepcopy(left_image)
+ left_image = copy.deepcopy(page.image)
+ right_image = copy.deepcopy(page.image)
# Draw clusters on both images
draw_clusters(left_image, left_clusters, scale_x, scale_y)
@@ -191,10 +186,7 @@ class LayoutModel(BasePageModel):
if settings.debug.visualize_raw_layout:
self.draw_clusters_and_cells_side_by_side(
- conv_res,
- page,
- clusters,
- mode_prefix="raw",
+ conv_res, page, clusters, mode_prefix="raw"
)
# Apply postprocessing
@@ -228,10 +220,7 @@ class LayoutModel(BasePageModel):
if settings.debug.visualize_layout:
self.draw_clusters_and_cells_side_by_side(
- conv_res,
- page,
- processed_clusters,
- mode_prefix="postprocessed",
+ conv_res, page, processed_clusters, mode_prefix="postprocessed"
)
yield page
diff --git a/docling/models/ocr_mac_model.py b/docling/models/ocr_mac_model.py
index 609b1240..6f90af23 100644
--- a/docling/models/ocr_mac_model.py
+++ b/docling/models/ocr_mac_model.py
@@ -107,10 +107,10 @@ class OcrMacModel(BaseOcrModel):
x2 = x1 + w * im_width
y1 = y2 - h * im_height
- left = x1 / self.scale
- top = y1 / self.scale
- right = x2 / self.scale
- bottom = y2 / self.scale
+ left = x1 / self.scale + ocr_rect.l
+ top = y1 / self.scale + ocr_rect.t
+ right = x2 / self.scale + ocr_rect.l
+ bottom = y2 / self.scale + ocr_rect.t
cells.append(
TextCell(
diff --git a/docling/models/table_structure_model.py b/docling/models/table_structure_model.py
index 05153ff9..2904b6ed 100644
--- a/docling/models/table_structure_model.py
+++ b/docling/models/table_structure_model.py
@@ -260,7 +260,7 @@ class TableStructureModel(BasePageModel):
)
new_bbox = _rotate_bbox(
new_cell.to_bounding_box(),
- orientation=-cells_orientation,
+ orientation=cells_orientation,
im_size=scaled_page_im.size,
).model_dump()
tokens.append(
diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test.doctags.txt b/tests/data_scanned/groundtruth/docling_v1/ocr_test.doctags.txt
index 19f5c6aa..20604b3e 100644
--- a/tests/data_scanned/groundtruth/docling_v1/ocr_test.doctags.txt
+++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test.doctags.txt
@@ -1,11 +1,8 @@
-This is a table test
-The test starts with some random text and then a table image:
-Some column
-Some other column
-Some row
-some cell
-have content
-Some other row
-other don't
+
+
+Vertically mergedOther merged columnYet another column
+valueSome other valueYet another value
+valueSome other valueYet another value
+
\ No newline at end of file
diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test.json b/tests/data_scanned/groundtruth/docling_v1/ocr_test.json
index 20934507..81ad10e7 100644
--- a/tests/data_scanned/groundtruth/docling_v1/ocr_test.json
+++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test.json
@@ -27,13 +27,13 @@
"file-info": {
"filename": "ocr_test.pdf",
"filename-prov": null,
- "document-hash": "4220c26a23a085eeca7ed3904ae0952e7e73458e65ce19e56170a9ce095b2313",
+ "document-hash": "0f391d12850f72bb91897f7f3bebfd4a0a8357e2a883ac1f664e32342c04e418",
"#-pages": 1,
"collection-name": null,
"description": null,
"page-hashes": [
{
- "hash": "07ff68c95cc6ec01fb38d02dc5d5efc466f3cfbf2e1dcb6c16b4e722d7f9f657",
+ "hash": "32f328168da3f69890a725c1168799f9ff7337249e98b1f36c12965551477be5",
"model": "default",
"page": 1
}
@@ -41,223 +41,307 @@
},
"main-text": [
{
- "prov": [
- {
- "bbox": [
- 201.26343,
- 690.10254,
- 417.96021,
- 719.14941
- ],
- "page": 1,
- "span": [
- 0,
- 20
- ],
- "__ref_s3_data": null
- }
- ],
- "text": "This is a table test",
- "type": "subtitle-level-1",
- "payload": null,
- "name": "Section-header",
- "font": null
- },
- {
- "prov": [
- {
- "bbox": [
- 72.0,
- 655.42273,
- 376.27319,
- 667.7117899999998
- ],
- "page": 1,
- "span": [
- 0,
- 61
- ],
- "__ref_s3_data": null
- }
- ],
- "text": "The test starts with some random text and then a table image:",
- "type": "paragraph",
- "payload": null,
- "name": "Text",
- "font": null
- },
- {
- "prov": [
- {
- "bbox": [
- 275.33333333333337,
- 601.0,
- 343.66666666666663,
- 609.6666666666666
- ],
- "page": 1,
- "span": [
- 0,
- 11
- ],
- "__ref_s3_data": null
- }
- ],
- "text": "Some column",
- "type": "paragraph",
- "payload": null,
- "name": "Text",
- "font": null
- },
- {
- "prov": [
- {
- "bbox": [
- 381.3333333333333,
- 601.0,
- 479.3333333333333,
- 609.6666666666666
- ],
- "page": 1,
- "span": [
- 0,
- 17
- ],
- "__ref_s3_data": null
- }
- ],
- "text": "Some other column",
- "type": "paragraph",
- "payload": null,
- "name": "Text",
- "font": null
- },
- {
- "prov": [
- {
- "bbox": [
- 175.0,
- 554.6666666666667,
- 225.66666666666669,
- 563.3333333333333
- ],
- "page": 1,
- "span": [
- 0,
- 8
- ],
- "__ref_s3_data": null
- }
- ],
- "text": "Some row",
- "type": "paragraph",
- "payload": null,
- "name": "Text",
- "font": null
- },
- {
- "prov": [
- {
- "bbox": [
- 286.0,
- 554.6666666666667,
- 333.0,
- 563.3333333333333
- ],
- "page": 1,
- "span": [
- 0,
- 9
- ],
- "__ref_s3_data": null
- }
- ],
- "text": "some cell",
- "type": "paragraph",
- "payload": null,
- "name": "Text",
- "font": null
- },
- {
- "prov": [
- {
- "bbox": [
- 398.3333333333333,
- 554.6666666666667,
- 463.0,
- 563.3333333333333
- ],
- "page": 1,
- "span": [
- 0,
- 12
- ],
- "__ref_s3_data": null
- }
- ],
- "text": "have content",
- "type": "paragraph",
- "payload": null,
- "name": "Text",
- "font": null
- },
- {
- "prov": [
- {
- "bbox": [
- 160.33333333333334,
- 508.33333333333337,
- 240.33333333333331,
- 517.0
- ],
- "page": 1,
- "span": [
- 0,
- 14
- ],
- "__ref_s3_data": null
- }
- ],
- "text": "Some other row",
- "type": "paragraph",
- "payload": null,
- "name": "Text",
- "font": null
- },
- {
- "prov": [
- {
- "bbox": [
- 283.0,
- 508.33333333333337,
- 336.33333333333337,
- 517.0
- ],
- "page": 1,
- "span": [
- 0,
- 11
- ],
- "__ref_s3_data": null
- }
- ],
- "text": "other don't",
- "type": "paragraph",
- "payload": null,
- "name": "Text",
- "font": null
+ "name": "Table",
+ "type": "table",
+ "$ref": "#/tables/0"
}
],
"figures": [],
- "tables": [],
+ "tables": [
+ {
+ "prov": [
+ {
+ "bbox": [
+ 69.04969024658203,
+ 277.41973876953125,
+ 551.0990600585938,
+ 524.3504486083984
+ ],
+ "page": 1,
+ "span": [
+ 0,
+ 0
+ ],
+ "__ref_s3_data": null
+ }
+ ],
+ "text": "",
+ "type": "table",
+ "payload": null,
+ "#-cols": 3,
+ "#-rows": 3,
+ "data": [
+ [
+ {
+ "bbox": [
+ 97.33333333333333,
+ 105.66666666666666,
+ 190.0,
+ 126.33333333333334
+ ],
+ "spans": [
+ [
+ 0,
+ 0
+ ]
+ ],
+ "text": "Vertically merged",
+ "type": "col_header",
+ "col": 0,
+ "col-header": true,
+ "col-span": [
+ 0,
+ 1
+ ],
+ "row": 0,
+ "row-header": false,
+ "row-span": [
+ 0,
+ 1
+ ]
+ },
+ {
+ "bbox": [
+ 232.66666666666666,
+ 105.66666666666666,
+ 364.0,
+ 126.33333333333334
+ ],
+ "spans": [
+ [
+ 0,
+ 1
+ ]
+ ],
+ "text": "Other merged column",
+ "type": "col_header",
+ "col": 1,
+ "col-header": true,
+ "col-span": [
+ 1,
+ 2
+ ],
+ "row": 0,
+ "row-header": false,
+ "row-span": [
+ 0,
+ 1
+ ]
+ },
+ {
+ "bbox": [
+ 406.3333333333333,
+ 105.66666666666666,
+ 518.3333333333333,
+ 121.66666666666666
+ ],
+ "spans": [
+ [
+ 0,
+ 2
+ ]
+ ],
+ "text": "Yet another column",
+ "type": "col_header",
+ "col": 2,
+ "col-header": true,
+ "col-span": [
+ 2,
+ 3
+ ],
+ "row": 0,
+ "row-header": false,
+ "row-span": [
+ 0,
+ 1
+ ]
+ }
+ ],
+ [
+ {
+ "bbox": [
+ 121.66666666666667,
+ 204.33333333333334,
+ 168.66666666666666,
+ 220.0
+ ],
+ "spans": [
+ [
+ 1,
+ 0
+ ]
+ ],
+ "text": "value",
+ "type": "body",
+ "col": 0,
+ "col-header": false,
+ "col-span": [
+ 0,
+ 1
+ ],
+ "row": 1,
+ "row-header": false,
+ "row-span": [
+ 1,
+ 2
+ ]
+ },
+ {
+ "bbox": [
+ 247.0,
+ 188.33333333333331,
+ 349.6666666666667,
+ 204.33333333333334
+ ],
+ "spans": [
+ [
+ 1,
+ 1
+ ]
+ ],
+ "text": "Some other value",
+ "type": "body",
+ "col": 1,
+ "col-header": false,
+ "col-span": [
+ 1,
+ 2
+ ],
+ "row": 1,
+ "row-header": false,
+ "row-span": [
+ 1,
+ 2
+ ]
+ },
+ {
+ "bbox": [
+ 408.3333333333333,
+ 188.33333333333331,
+ 514.0,
+ 204.33333333333334
+ ],
+ "spans": [
+ [
+ 1,
+ 2
+ ]
+ ],
+ "text": "Yet another value",
+ "type": "body",
+ "col": 2,
+ "col-header": false,
+ "col-span": [
+ 2,
+ 3
+ ],
+ "row": 1,
+ "row-header": false,
+ "row-span": [
+ 1,
+ 2
+ ]
+ }
+ ],
+ [
+ {
+ "bbox": [
+ 121.66666666666667,
+ 284.0,
+ 168.66666666666666,
+ 300.0
+ ],
+ "spans": [
+ [
+ 2,
+ 0
+ ]
+ ],
+ "text": "value",
+ "type": "body",
+ "col": 0,
+ "col-header": false,
+ "col-span": [
+ 0,
+ 1
+ ],
+ "row": 2,
+ "row-header": false,
+ "row-span": [
+ 2,
+ 3
+ ]
+ },
+ {
+ "bbox": [
+ 247.0,
+ 268.0,
+ 349.6666666666667,
+ 284.0
+ ],
+ "spans": [
+ [
+ 2,
+ 1
+ ]
+ ],
+ "text": "Some other value",
+ "type": "body",
+ "col": 1,
+ "col-header": false,
+ "col-span": [
+ 1,
+ 2
+ ],
+ "row": 2,
+ "row-header": false,
+ "row-span": [
+ 2,
+ 3
+ ]
+ },
+ {
+ "bbox": [
+ 408.3333333333333,
+ 268.0,
+ 514.0,
+ 284.0
+ ],
+ "spans": [
+ [
+ 2,
+ 2
+ ]
+ ],
+ "text": "Yet another value",
+ "type": "body",
+ "col": 2,
+ "col-header": false,
+ "col-span": [
+ 2,
+ 3
+ ],
+ "row": 2,
+ "row-header": false,
+ "row-span": [
+ 2,
+ 3
+ ]
+ }
+ ]
+ ],
+ "model": null,
+ "bounding-box": null
+ }
+ ],
"bitmaps": null,
"equations": [],
"footnotes": [],
"page-dimensions": [
{
- "height": 792.0,
+ "height": 612.0,
"page": 1,
- "width": 612.0
+ "width": 792.0
}
],
"page-footers": [],
diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test.md b/tests/data_scanned/groundtruth/docling_v1/ocr_test.md
index c466de2b..e3d7c0b8 100644
--- a/tests/data_scanned/groundtruth/docling_v1/ocr_test.md
+++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test.md
@@ -1,5 +1,4 @@
-| | Column 0 | Column 1 | Column 2 |
-|----------------|------------|--------------|------------|
-| this is row 0 | some cells | have content | and |
-| and row 1 | | other | have |
-| and last row 2 | nothing | | inside |
\ No newline at end of file
+| Vertically merged | Other merged column | Yet another column |
+|---------------------|-----------------------|----------------------|
+| value | Some other value | Yet another value |
+| value | Some other value | Yet another value |
\ No newline at end of file
diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test.pages.json b/tests/data_scanned/groundtruth/docling_v1/ocr_test.pages.json
index 8bfcaa25..f9ed59fd 100644
--- a/tests/data_scanned/groundtruth/docling_v1/ocr_test.pages.json
+++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test.pages.json
@@ -2,8 +2,8 @@
{
"page_no": 0,
"size": {
- "width": 612.0,
- "height": 792.0
+ "width": 792.0,
+ "height": 612.0
},
"parsed_page": {
"dimension": {
@@ -11,47 +11,47 @@
"rect": {
"r_x0": 0.0,
"r_y0": 0.0,
- "r_x1": 612.0,
+ "r_x1": 792.0,
"r_y1": 0.0,
- "r_x2": 612.0,
- "r_y2": 792.0,
+ "r_x2": 792.0,
+ "r_y2": 612.0,
"r_x3": 0.0,
- "r_y3": 792.0,
+ "r_y3": 612.0,
"coord_origin": "BOTTOMLEFT"
},
"boundary_type": "crop_box",
"art_bbox": {
"l": 0.0,
- "t": 792.0,
- "r": 612.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
},
"bleed_bbox": {
"l": 0.0,
- "t": 792.0,
- "r": 612.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
},
"crop_bbox": {
"l": 0.0,
- "t": 792.0,
- "r": 612.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
},
"media_bbox": {
"l": 0.0,
- "t": 792.0,
- "r": 612.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
},
"trim_bbox": {
"l": 0.0,
- "t": 792.0,
- "r": 612.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
}
@@ -69,21 +69,21 @@
"a": 255
},
"rect": {
- "r_x0": 201.26343,
- "r_y0": 101.89746000000002,
- "r_x1": 417.96021,
- "r_y1": 101.89746000000002,
- "r_x2": 417.96021,
- "r_y2": 72.85059000000001,
- "r_x3": 201.26343,
- "r_y3": 72.85059000000001,
+ "r_x0": 97.33333333333333,
+ "r_y0": 126.33333333333334,
+ "r_x1": 190.0,
+ "r_y1": 126.33333333333334,
+ "r_x2": 190.0,
+ "r_y2": 105.66666666666666,
+ "r_x3": 97.33333333333333,
+ "r_y3": 105.66666666666666,
"coord_origin": "TOPLEFT"
},
- "text": "This is a table test ",
- "orig": "This is a table test ",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 89.0,
+ "from_ocr": true
},
{
"index": 1,
@@ -94,21 +94,21 @@
"a": 255
},
"rect": {
- "r_x0": 72.0,
- "r_y0": 136.57727,
- "r_x1": 376.27319,
- "r_y1": 136.57727,
- "r_x2": 376.27319,
- "r_y2": 124.28821000000016,
- "r_x3": 72.0,
- "r_y3": 124.28821000000016,
+ "r_x0": 112.0,
+ "r_y0": 157.66666666666669,
+ "r_x1": 182.33333333333334,
+ "r_y1": 157.66666666666669,
+ "r_x2": 182.33333333333334,
+ "r_y2": 137.0,
+ "r_x3": 112.0,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "The test starts with some random text and then a table image: ",
- "orig": "The test starts with some random text and then a table image: ",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 2,
@@ -119,20 +119,20 @@
"a": 255
},
"rect": {
- "r_x0": 275.33333333333337,
- "r_y0": 191.0,
- "r_x1": 304.0,
- "r_y1": 191.0,
- "r_x2": 304.0,
- "r_y2": 182.33333333333334,
- "r_x3": 275.33333333333337,
- "r_y3": 182.33333333333334,
+ "r_x0": 121.66666666666667,
+ "r_y0": 220.0,
+ "r_x1": 168.66666666666666,
+ "r_y1": 220.0,
+ "r_x2": 168.66666666666666,
+ "r_y2": 204.33333333333334,
+ "r_x3": 121.66666666666667,
+ "r_y3": 204.33333333333334,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9609484899999999,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -144,20 +144,20 @@
"a": 255
},
"rect": {
- "r_x0": 308.0,
- "r_y0": 191.0,
- "r_x1": 343.66666666666663,
- "r_y1": 191.0,
- "r_x2": 343.66666666666663,
- "r_y2": 182.33333333333334,
- "r_x3": 308.0,
- "r_y3": 182.33333333333334,
+ "r_x0": 121.66666666666667,
+ "r_y0": 300.0,
+ "r_x1": 168.66666666666666,
+ "r_y1": 300.0,
+ "r_x2": 168.66666666666666,
+ "r_y2": 284.0,
+ "r_x3": 121.66666666666667,
+ "r_y3": 284.0,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.95935837,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -169,20 +169,20 @@
"a": 255
},
"rect": {
- "r_x0": 381.3333333333333,
- "r_y0": 191.0,
- "r_x1": 410.3333333333333,
- "r_y1": 191.0,
- "r_x2": 410.3333333333333,
- "r_y2": 182.33333333333334,
- "r_x3": 381.3333333333333,
- "r_y3": 182.33333333333334,
+ "r_x0": 232.66666666666666,
+ "r_y0": 126.33333333333334,
+ "r_x1": 364.0,
+ "r_y1": 126.33333333333334,
+ "r_x2": 364.0,
+ "r_y2": 105.66666666666666,
+ "r_x3": 232.66666666666666,
+ "r_y3": 105.66666666666666,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 0.95280136,
+ "confidence": 92.0,
"from_ocr": true
},
{
@@ -194,20 +194,20 @@
"a": 255
},
"rect": {
- "r_x0": 414.3333333333333,
- "r_y0": 191.0,
- "r_x1": 440.3333333333333,
- "r_y1": 191.0,
- "r_x2": 440.3333333333333,
- "r_y2": 182.33333333333334,
- "r_x3": 414.3333333333333,
- "r_y3": 182.33333333333334,
+ "r_x0": 265.66666666666663,
+ "r_y0": 153.0,
+ "r_x1": 336.0,
+ "r_y1": 153.0,
+ "r_x2": 336.0,
+ "r_y2": 137.0,
+ "r_x3": 265.66666666666663,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9649115,
+ "confidence": 94.0,
"from_ocr": true
},
{
@@ -219,20 +219,20 @@
"a": 255
},
"rect": {
- "r_x0": 443.3333333333333,
- "r_y0": 191.0,
- "r_x1": 479.3333333333333,
- "r_y1": 191.0,
- "r_x2": 479.3333333333333,
- "r_y2": 182.33333333333334,
- "r_x3": 443.3333333333333,
- "r_y3": 182.33333333333334,
+ "r_x0": 247.0,
+ "r_y0": 204.33333333333334,
+ "r_x1": 349.6666666666667,
+ "r_y1": 204.33333333333334,
+ "r_x2": 349.6666666666667,
+ "r_y2": 188.33333333333331,
+ "r_x3": 247.0,
+ "r_y3": 188.33333333333331,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.9639427899999999,
+ "confidence": 94.0,
"from_ocr": true
},
{
@@ -244,20 +244,20 @@
"a": 255
},
"rect": {
- "r_x0": 175.0,
- "r_y0": 237.33333333333331,
- "r_x1": 204.0,
- "r_y1": 237.33333333333331,
- "r_x2": 204.0,
- "r_y2": 228.66666666666669,
- "r_x3": 175.0,
- "r_y3": 228.66666666666669,
+ "r_x0": 277.0,
+ "r_y0": 236.0,
+ "r_x1": 324.3333333333333,
+ "r_y1": 236.0,
+ "r_x2": 324.3333333333333,
+ "r_y2": 220.0,
+ "r_x3": 277.0,
+ "r_y3": 220.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96050453,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -269,20 +269,20 @@
"a": 255
},
"rect": {
- "r_x0": 208.0,
- "r_y0": 237.33333333333331,
- "r_x1": 225.66666666666669,
- "r_y1": 237.33333333333331,
- "r_x2": 225.66666666666669,
- "r_y2": 231.0,
- "r_x3": 208.0,
- "r_y3": 231.0,
+ "r_x0": 247.0,
+ "r_y0": 284.0,
+ "r_x1": 349.6666666666667,
+ "r_y1": 284.0,
+ "r_x2": 349.6666666666667,
+ "r_y2": 268.0,
+ "r_x3": 247.0,
+ "r_y3": 268.0,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.9623416899999999,
+ "confidence": 92.0,
"from_ocr": true
},
{
@@ -294,20 +294,20 @@
"a": 255
},
"rect": {
- "r_x0": 286.0,
- "r_y0": 237.33333333333331,
- "r_x1": 313.0,
- "r_y1": 237.33333333333331,
- "r_x2": 313.0,
- "r_y2": 231.0,
- "r_x3": 286.0,
- "r_y3": 231.0,
+ "r_x0": 277.0,
+ "r_y0": 315.33333333333337,
+ "r_x1": 324.3333333333333,
+ "r_y1": 315.33333333333337,
+ "r_x2": 324.3333333333333,
+ "r_y2": 299.66666666666663,
+ "r_x3": 277.0,
+ "r_y3": 299.66666666666663,
"coord_origin": "TOPLEFT"
},
- "text": "some",
- "orig": "some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96279846,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -319,20 +319,20 @@
"a": 255
},
"rect": {
- "r_x0": 317.0,
- "r_y0": 237.33333333333331,
- "r_x1": 333.0,
- "r_y1": 237.33333333333331,
- "r_x2": 333.0,
- "r_y2": 228.66666666666669,
- "r_x3": 317.0,
- "r_y3": 228.66666666666669,
+ "r_x0": 406.3333333333333,
+ "r_y0": 121.66666666666666,
+ "r_x1": 518.3333333333333,
+ "r_y1": 121.66666666666666,
+ "r_x2": 518.3333333333333,
+ "r_y2": 105.66666666666666,
+ "r_x3": 406.3333333333333,
+ "r_y3": 105.66666666666666,
"coord_origin": "TOPLEFT"
},
- "text": "cell",
- "orig": "cell",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.96231712,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -344,20 +344,20 @@
"a": 255
},
"rect": {
- "r_x0": 398.3333333333333,
- "r_y0": 237.33333333333331,
- "r_x1": 422.0,
- "r_y1": 237.33333333333331,
- "r_x2": 422.0,
- "r_y2": 228.66666666666669,
- "r_x3": 398.3333333333333,
- "r_y3": 228.66666666666669,
+ "r_x0": 429.3333333333333,
+ "r_y0": 153.0,
+ "r_x1": 499.3333333333333,
+ "r_y1": 153.0,
+ "r_x2": 499.3333333333333,
+ "r_y2": 137.0,
+ "r_x3": 429.3333333333333,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.96670181,
+ "confidence": 94.0,
"from_ocr": true
},
{
@@ -369,20 +369,20 @@
"a": 255
},
"rect": {
- "r_x0": 426.0,
- "r_y0": 237.33333333333331,
- "r_x1": 463.0,
- "r_y1": 237.33333333333331,
- "r_x2": 463.0,
- "r_y2": 229.0,
- "r_x3": 426.0,
- "r_y3": 229.0,
+ "r_x0": 408.3333333333333,
+ "r_y0": 204.33333333333334,
+ "r_x1": 514.0,
+ "r_y1": 204.33333333333334,
+ "r_x2": 514.0,
+ "r_y2": 188.33333333333331,
+ "r_x3": 408.3333333333333,
+ "r_y3": 188.33333333333331,
"coord_origin": "TOPLEFT"
},
- "text": "content",
- "orig": "content",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.9589679700000001,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -394,20 +394,20 @@
"a": 255
},
"rect": {
- "r_x0": 160.33333333333334,
- "r_y0": 283.66666666666663,
- "r_x1": 189.33333333333331,
- "r_y1": 283.66666666666663,
- "r_x2": 189.33333333333331,
- "r_y2": 275.0,
- "r_x3": 160.33333333333334,
- "r_y3": 275.0,
+ "r_x0": 440.6666666666667,
+ "r_y0": 236.0,
+ "r_x1": 487.6666666666667,
+ "r_y1": 236.0,
+ "r_x2": 487.6666666666667,
+ "r_y2": 220.0,
+ "r_x3": 440.6666666666667,
+ "r_y3": 220.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.95674171,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -419,20 +419,20 @@
"a": 255
},
"rect": {
- "r_x0": 193.0,
- "r_y0": 283.66666666666663,
- "r_x1": 219.0,
- "r_y1": 283.66666666666663,
- "r_x2": 219.0,
- "r_y2": 275.0,
- "r_x3": 193.0,
- "r_y3": 275.0,
+ "r_x0": 408.3333333333333,
+ "r_y0": 284.0,
+ "r_x1": 514.0,
+ "r_y1": 284.0,
+ "r_x2": 514.0,
+ "r_y2": 268.0,
+ "r_x3": 408.3333333333333,
+ "r_y3": 268.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.9601168099999999,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -444,70 +444,20 @@
"a": 255
},
"rect": {
- "r_x0": 222.66666666666669,
- "r_y0": 283.66666666666663,
- "r_x1": 240.33333333333331,
- "r_y1": 283.66666666666663,
- "r_x2": 240.33333333333331,
- "r_y2": 277.33333333333337,
- "r_x3": 222.66666666666669,
- "r_y3": 277.33333333333337,
+ "r_x0": 440.6666666666667,
+ "r_y0": 315.33333333333337,
+ "r_x1": 487.6666666666667,
+ "r_y1": 315.33333333333337,
+ "r_x2": 487.6666666666667,
+ "r_y2": 299.66666666666663,
+ "r_x3": 440.6666666666667,
+ "r_y3": 299.66666666666663,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96364174,
- "from_ocr": true
- },
- {
- "index": 16,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 283.0,
- "r_y0": 283.66666666666663,
- "r_x1": 309.0,
- "r_y1": 283.66666666666663,
- "r_x2": 309.0,
- "r_y2": 275.0,
- "r_x3": 283.0,
- "r_y3": 275.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.9636872099999999,
- "from_ocr": true
- },
- {
- "index": 17,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 312.33333333333337,
- "r_y0": 283.66666666666663,
- "r_x1": 336.33333333333337,
- "r_y1": 283.66666666666663,
- "r_x2": 336.33333333333337,
- "r_y2": 275.0,
- "r_x3": 312.33333333333337,
- "r_y3": 275.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "don't",
- "orig": "don't",
- "text_direction": "left_to_right",
- "confidence": 0.9636872099999999,
+ "confidence": 95.0,
"from_ocr": true
}
],
@@ -521,16 +471,16 @@
"layout": {
"clusters": [
{
- "id": 9,
- "label": "section_header",
+ "id": 0,
+ "label": "table",
"bbox": {
- "l": 201.26343,
- "t": 72.85059000000001,
- "r": 417.96021,
- "b": 101.89746000000002,
+ "l": 69.04969024658203,
+ "t": 87.64955139160156,
+ "r": 551.0990600585938,
+ "b": 334.58026123046875,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.6777006387710571,
+ "confidence": 0.9790865778923035,
"cells": [
{
"index": 0,
@@ -541,37 +491,22 @@
"a": 255
},
"rect": {
- "r_x0": 201.26343,
- "r_y0": 101.89746000000002,
- "r_x1": 417.96021,
- "r_y1": 101.89746000000002,
- "r_x2": 417.96021,
- "r_y2": 72.85059000000001,
- "r_x3": 201.26343,
- "r_y3": 72.85059000000001,
+ "r_x0": 97.33333333333333,
+ "r_y0": 126.33333333333334,
+ "r_x1": 190.0,
+ "r_y1": 126.33333333333334,
+ "r_x2": 190.0,
+ "r_y2": 105.66666666666666,
+ "r_x3": 97.33333333333333,
+ "r_y3": 105.66666666666666,
"coord_origin": "TOPLEFT"
},
- "text": "This is a table test ",
- "orig": "This is a table test ",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- }
- ],
- "children": []
- },
- {
- "id": 7,
- "label": "text",
- "bbox": {
- "l": 72.0,
- "t": 124.28821000000016,
- "r": 376.27319,
- "b": 136.57727,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.8428522944450378,
- "cells": [
+ "confidence": 89.0,
+ "from_ocr": true
+ },
{
"index": 1,
"rgba": {
@@ -581,37 +516,22 @@
"a": 255
},
"rect": {
- "r_x0": 72.0,
- "r_y0": 136.57727,
- "r_x1": 376.27319,
- "r_y1": 136.57727,
- "r_x2": 376.27319,
- "r_y2": 124.28821000000016,
- "r_x3": 72.0,
- "r_y3": 124.28821000000016,
+ "r_x0": 112.0,
+ "r_y0": 157.66666666666669,
+ "r_x1": 182.33333333333334,
+ "r_y1": 157.66666666666669,
+ "r_x2": 182.33333333333334,
+ "r_y2": 137.0,
+ "r_x3": 112.0,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "The test starts with some random text and then a table image: ",
- "orig": "The test starts with some random text and then a table image: ",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- }
- ],
- "children": []
- },
- {
- "id": 8,
- "label": "form",
- "bbox": {
- "l": 160.33333333333334,
- "t": 182.33333333333334,
- "r": 479.3333333333333,
- "b": 283.66666666666663,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.7274590134620667,
- "cells": [
+ "confidence": 92.0,
+ "from_ocr": true
+ },
{
"index": 2,
"rgba": {
@@ -621,20 +541,20 @@
"a": 255
},
"rect": {
- "r_x0": 275.33333333333337,
- "r_y0": 191.0,
- "r_x1": 304.0,
- "r_y1": 191.0,
- "r_x2": 304.0,
- "r_y2": 182.33333333333334,
- "r_x3": 275.33333333333337,
- "r_y3": 182.33333333333334,
+ "r_x0": 121.66666666666667,
+ "r_y0": 220.0,
+ "r_x1": 168.66666666666666,
+ "r_y1": 220.0,
+ "r_x2": 168.66666666666666,
+ "r_y2": 204.33333333333334,
+ "r_x3": 121.66666666666667,
+ "r_y3": 204.33333333333334,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9609484899999999,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -646,20 +566,20 @@
"a": 255
},
"rect": {
- "r_x0": 308.0,
- "r_y0": 191.0,
- "r_x1": 343.66666666666663,
- "r_y1": 191.0,
- "r_x2": 343.66666666666663,
- "r_y2": 182.33333333333334,
- "r_x3": 308.0,
- "r_y3": 182.33333333333334,
+ "r_x0": 121.66666666666667,
+ "r_y0": 300.0,
+ "r_x1": 168.66666666666666,
+ "r_y1": 300.0,
+ "r_x2": 168.66666666666666,
+ "r_y2": 284.0,
+ "r_x3": 121.66666666666667,
+ "r_y3": 284.0,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.95935837,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -671,20 +591,20 @@
"a": 255
},
"rect": {
- "r_x0": 381.3333333333333,
- "r_y0": 191.0,
- "r_x1": 410.3333333333333,
- "r_y1": 191.0,
- "r_x2": 410.3333333333333,
- "r_y2": 182.33333333333334,
- "r_x3": 381.3333333333333,
- "r_y3": 182.33333333333334,
+ "r_x0": 232.66666666666666,
+ "r_y0": 126.33333333333334,
+ "r_x1": 364.0,
+ "r_y1": 126.33333333333334,
+ "r_x2": 364.0,
+ "r_y2": 105.66666666666666,
+ "r_x3": 232.66666666666666,
+ "r_y3": 105.66666666666666,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 0.95280136,
+ "confidence": 92.0,
"from_ocr": true
},
{
@@ -696,20 +616,20 @@
"a": 255
},
"rect": {
- "r_x0": 414.3333333333333,
- "r_y0": 191.0,
- "r_x1": 440.3333333333333,
- "r_y1": 191.0,
- "r_x2": 440.3333333333333,
- "r_y2": 182.33333333333334,
- "r_x3": 414.3333333333333,
- "r_y3": 182.33333333333334,
+ "r_x0": 265.66666666666663,
+ "r_y0": 153.0,
+ "r_x1": 336.0,
+ "r_y1": 153.0,
+ "r_x2": 336.0,
+ "r_y2": 137.0,
+ "r_x3": 265.66666666666663,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9649115,
+ "confidence": 94.0,
"from_ocr": true
},
{
@@ -721,20 +641,20 @@
"a": 255
},
"rect": {
- "r_x0": 443.3333333333333,
- "r_y0": 191.0,
- "r_x1": 479.3333333333333,
- "r_y1": 191.0,
- "r_x2": 479.3333333333333,
- "r_y2": 182.33333333333334,
- "r_x3": 443.3333333333333,
- "r_y3": 182.33333333333334,
+ "r_x0": 247.0,
+ "r_y0": 204.33333333333334,
+ "r_x1": 349.6666666666667,
+ "r_y1": 204.33333333333334,
+ "r_x2": 349.6666666666667,
+ "r_y2": 188.33333333333331,
+ "r_x3": 247.0,
+ "r_y3": 188.33333333333331,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.9639427899999999,
+ "confidence": 94.0,
"from_ocr": true
},
{
@@ -746,20 +666,20 @@
"a": 255
},
"rect": {
- "r_x0": 175.0,
- "r_y0": 237.33333333333331,
- "r_x1": 204.0,
- "r_y1": 237.33333333333331,
- "r_x2": 204.0,
- "r_y2": 228.66666666666669,
- "r_x3": 175.0,
- "r_y3": 228.66666666666669,
+ "r_x0": 277.0,
+ "r_y0": 236.0,
+ "r_x1": 324.3333333333333,
+ "r_y1": 236.0,
+ "r_x2": 324.3333333333333,
+ "r_y2": 220.0,
+ "r_x3": 277.0,
+ "r_y3": 220.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96050453,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -771,20 +691,20 @@
"a": 255
},
"rect": {
- "r_x0": 208.0,
- "r_y0": 237.33333333333331,
- "r_x1": 225.66666666666669,
- "r_y1": 237.33333333333331,
- "r_x2": 225.66666666666669,
- "r_y2": 231.0,
- "r_x3": 208.0,
- "r_y3": 231.0,
+ "r_x0": 247.0,
+ "r_y0": 284.0,
+ "r_x1": 349.6666666666667,
+ "r_y1": 284.0,
+ "r_x2": 349.6666666666667,
+ "r_y2": 268.0,
+ "r_x3": 247.0,
+ "r_y3": 268.0,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.9623416899999999,
+ "confidence": 92.0,
"from_ocr": true
},
{
@@ -796,20 +716,20 @@
"a": 255
},
"rect": {
- "r_x0": 286.0,
- "r_y0": 237.33333333333331,
- "r_x1": 313.0,
- "r_y1": 237.33333333333331,
- "r_x2": 313.0,
- "r_y2": 231.0,
- "r_x3": 286.0,
- "r_y3": 231.0,
+ "r_x0": 277.0,
+ "r_y0": 315.33333333333337,
+ "r_x1": 324.3333333333333,
+ "r_y1": 315.33333333333337,
+ "r_x2": 324.3333333333333,
+ "r_y2": 299.66666666666663,
+ "r_x3": 277.0,
+ "r_y3": 299.66666666666663,
"coord_origin": "TOPLEFT"
},
- "text": "some",
- "orig": "some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96279846,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -821,20 +741,20 @@
"a": 255
},
"rect": {
- "r_x0": 317.0,
- "r_y0": 237.33333333333331,
- "r_x1": 333.0,
- "r_y1": 237.33333333333331,
- "r_x2": 333.0,
- "r_y2": 228.66666666666669,
- "r_x3": 317.0,
- "r_y3": 228.66666666666669,
+ "r_x0": 406.3333333333333,
+ "r_y0": 121.66666666666666,
+ "r_x1": 518.3333333333333,
+ "r_y1": 121.66666666666666,
+ "r_x2": 518.3333333333333,
+ "r_y2": 105.66666666666666,
+ "r_x3": 406.3333333333333,
+ "r_y3": 105.66666666666666,
"coord_origin": "TOPLEFT"
},
- "text": "cell",
- "orig": "cell",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.96231712,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -846,20 +766,20 @@
"a": 255
},
"rect": {
- "r_x0": 398.3333333333333,
- "r_y0": 237.33333333333331,
- "r_x1": 422.0,
- "r_y1": 237.33333333333331,
- "r_x2": 422.0,
- "r_y2": 228.66666666666669,
- "r_x3": 398.3333333333333,
- "r_y3": 228.66666666666669,
+ "r_x0": 429.3333333333333,
+ "r_y0": 153.0,
+ "r_x1": 499.3333333333333,
+ "r_y1": 153.0,
+ "r_x2": 499.3333333333333,
+ "r_y2": 137.0,
+ "r_x3": 429.3333333333333,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.96670181,
+ "confidence": 94.0,
"from_ocr": true
},
{
@@ -871,20 +791,20 @@
"a": 255
},
"rect": {
- "r_x0": 426.0,
- "r_y0": 237.33333333333331,
- "r_x1": 463.0,
- "r_y1": 237.33333333333331,
- "r_x2": 463.0,
- "r_y2": 229.0,
- "r_x3": 426.0,
- "r_y3": 229.0,
+ "r_x0": 408.3333333333333,
+ "r_y0": 204.33333333333334,
+ "r_x1": 514.0,
+ "r_y1": 204.33333333333334,
+ "r_x2": 514.0,
+ "r_y2": 188.33333333333331,
+ "r_x3": 408.3333333333333,
+ "r_y3": 188.33333333333331,
"coord_origin": "TOPLEFT"
},
- "text": "content",
- "orig": "content",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.9589679700000001,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -896,20 +816,20 @@
"a": 255
},
"rect": {
- "r_x0": 160.33333333333334,
- "r_y0": 283.66666666666663,
- "r_x1": 189.33333333333331,
- "r_y1": 283.66666666666663,
- "r_x2": 189.33333333333331,
- "r_y2": 275.0,
- "r_x3": 160.33333333333334,
- "r_y3": 275.0,
+ "r_x0": 440.6666666666667,
+ "r_y0": 236.0,
+ "r_x1": 487.6666666666667,
+ "r_y1": 236.0,
+ "r_x2": 487.6666666666667,
+ "r_y2": 220.0,
+ "r_x3": 440.6666666666667,
+ "r_y3": 220.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.95674171,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -921,20 +841,20 @@
"a": 255
},
"rect": {
- "r_x0": 193.0,
- "r_y0": 283.66666666666663,
- "r_x1": 219.0,
- "r_y1": 283.66666666666663,
- "r_x2": 219.0,
- "r_y2": 275.0,
- "r_x3": 193.0,
- "r_y3": 275.0,
+ "r_x0": 408.3333333333333,
+ "r_y0": 284.0,
+ "r_x1": 514.0,
+ "r_y1": 284.0,
+ "r_x2": 514.0,
+ "r_y2": 268.0,
+ "r_x3": 408.3333333333333,
+ "r_y3": 268.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.9601168099999999,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -946,85 +866,115 @@
"a": 255
},
"rect": {
- "r_x0": 222.66666666666669,
- "r_y0": 283.66666666666663,
- "r_x1": 240.33333333333331,
- "r_y1": 283.66666666666663,
- "r_x2": 240.33333333333331,
- "r_y2": 277.33333333333337,
- "r_x3": 222.66666666666669,
- "r_y3": 277.33333333333337,
+ "r_x0": 440.6666666666667,
+ "r_y0": 315.33333333333337,
+ "r_x1": 487.6666666666667,
+ "r_y1": 315.33333333333337,
+ "r_x2": 487.6666666666667,
+ "r_y2": 299.66666666666663,
+ "r_x3": 440.6666666666667,
+ "r_y3": 299.66666666666663,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96364174,
- "from_ocr": true
- },
- {
- "index": 16,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 283.0,
- "r_y0": 283.66666666666663,
- "r_x1": 309.0,
- "r_y1": 283.66666666666663,
- "r_x2": 309.0,
- "r_y2": 275.0,
- "r_x3": 283.0,
- "r_y3": 275.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.9636872099999999,
- "from_ocr": true
- },
- {
- "index": 17,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 312.33333333333337,
- "r_y0": 283.66666666666663,
- "r_x1": 336.33333333333337,
- "r_y1": 283.66666666666663,
- "r_x2": 336.33333333333337,
- "r_y2": 275.0,
- "r_x3": 312.33333333333337,
- "r_y3": 275.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "don't",
- "orig": "don't",
- "text_direction": "left_to_right",
- "confidence": 0.9636872099999999,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": [
{
- "id": 4,
+ "id": 1,
"label": "text",
"bbox": {
- "l": 275.33333333333337,
- "t": 182.33333333333334,
- "r": 343.66666666666663,
- "b": 191.0,
+ "l": 97.33333333333333,
+ "t": 105.66666666666666,
+ "r": 190.0,
+ "b": 126.33333333333334,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9056976437568665,
+ "confidence": 89.0,
+ "cells": [
+ {
+ "index": 0,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 97.33333333333333,
+ "r_y0": 126.33333333333334,
+ "r_x1": 190.0,
+ "r_y1": 126.33333333333334,
+ "r_x2": 190.0,
+ "r_y2": 105.66666666666666,
+ "r_x3": 97.33333333333333,
+ "r_y3": 105.66666666666666,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Vertically",
+ "orig": "Vertically",
+ "text_direction": "left_to_right",
+ "confidence": 89.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 2,
+ "label": "text",
+ "bbox": {
+ "l": 112.0,
+ "t": 137.0,
+ "r": 182.33333333333334,
+ "b": 157.66666666666669,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 92.0,
+ "cells": [
+ {
+ "index": 1,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 112.0,
+ "r_y0": 157.66666666666669,
+ "r_x1": 182.33333333333334,
+ "r_y1": 157.66666666666669,
+ "r_x2": 182.33333333333334,
+ "r_y2": 137.0,
+ "r_x3": 112.0,
+ "r_y3": 137.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "merged",
+ "orig": "merged",
+ "text_direction": "left_to_right",
+ "confidence": 92.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 3,
+ "label": "text",
+ "bbox": {
+ "l": 121.66666666666667,
+ "t": 204.33333333333334,
+ "r": 168.66666666666666,
+ "b": 220.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
"cells": [
{
"index": 2,
@@ -1035,22 +985,37 @@
"a": 255
},
"rect": {
- "r_x0": 275.33333333333337,
- "r_y0": 191.0,
- "r_x1": 304.0,
- "r_y1": 191.0,
- "r_x2": 304.0,
- "r_y2": 182.33333333333334,
- "r_x3": 275.33333333333337,
- "r_y3": 182.33333333333334,
+ "r_x0": 121.66666666666667,
+ "r_y0": 220.0,
+ "r_x1": 168.66666666666666,
+ "r_y1": 220.0,
+ "r_x2": 168.66666666666666,
+ "r_y2": 204.33333333333334,
+ "r_x3": 121.66666666666667,
+ "r_y3": 204.33333333333334,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9609484899999999,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 4,
+ "label": "text",
+ "bbox": {
+ "l": 121.66666666666667,
+ "t": 284.0,
+ "r": 168.66666666666666,
+ "b": 300.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
{
"index": 3,
"rgba": {
@@ -1060,20 +1025,20 @@
"a": 255
},
"rect": {
- "r_x0": 308.0,
- "r_y0": 191.0,
- "r_x1": 343.66666666666663,
- "r_y1": 191.0,
- "r_x2": 343.66666666666663,
- "r_y2": 182.33333333333334,
- "r_x3": 308.0,
- "r_y3": 182.33333333333334,
+ "r_x0": 121.66666666666667,
+ "r_y0": 300.0,
+ "r_x1": 168.66666666666666,
+ "r_y1": 300.0,
+ "r_x2": 168.66666666666666,
+ "r_y2": 284.0,
+ "r_x3": 121.66666666666667,
+ "r_y3": 284.0,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.95935837,
+ "confidence": 96.0,
"from_ocr": true
}
],
@@ -1083,13 +1048,13 @@
"id": 5,
"label": "text",
"bbox": {
- "l": 381.3333333333333,
- "t": 182.33333333333334,
- "r": 479.3333333333333,
- "b": 191.0,
+ "l": 232.66666666666666,
+ "t": 105.66666666666666,
+ "r": 364.0,
+ "b": 126.33333333333334,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9007152318954468,
+ "confidence": 92.0,
"cells": [
{
"index": 4,
@@ -1100,22 +1065,37 @@
"a": 255
},
"rect": {
- "r_x0": 381.3333333333333,
- "r_y0": 191.0,
- "r_x1": 410.3333333333333,
- "r_y1": 191.0,
- "r_x2": 410.3333333333333,
- "r_y2": 182.33333333333334,
- "r_x3": 381.3333333333333,
- "r_y3": 182.33333333333334,
+ "r_x0": 232.66666666666666,
+ "r_y0": 126.33333333333334,
+ "r_x1": 364.0,
+ "r_y1": 126.33333333333334,
+ "r_x2": 364.0,
+ "r_y2": 105.66666666666666,
+ "r_x3": 232.66666666666666,
+ "r_y3": 105.66666666666666,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 0.95280136,
+ "confidence": 92.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 6,
+ "label": "text",
+ "bbox": {
+ "l": 265.66666666666663,
+ "t": 137.0,
+ "r": 336.0,
+ "b": 153.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
{
"index": 5,
"rgba": {
@@ -1125,22 +1105,37 @@
"a": 255
},
"rect": {
- "r_x0": 414.3333333333333,
- "r_y0": 191.0,
- "r_x1": 440.3333333333333,
- "r_y1": 191.0,
- "r_x2": 440.3333333333333,
- "r_y2": 182.33333333333334,
- "r_x3": 414.3333333333333,
- "r_y3": 182.33333333333334,
+ "r_x0": 265.66666666666663,
+ "r_y0": 153.0,
+ "r_x1": 336.0,
+ "r_y1": 153.0,
+ "r_x2": 336.0,
+ "r_y2": 137.0,
+ "r_x3": 265.66666666666663,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9649115,
+ "confidence": 94.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 7,
+ "label": "text",
+ "bbox": {
+ "l": 247.0,
+ "t": 188.33333333333331,
+ "r": 349.6666666666667,
+ "b": 204.33333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
{
"index": 6,
"rgba": {
@@ -1150,36 +1145,36 @@
"a": 255
},
"rect": {
- "r_x0": 443.3333333333333,
- "r_y0": 191.0,
- "r_x1": 479.3333333333333,
- "r_y1": 191.0,
- "r_x2": 479.3333333333333,
- "r_y2": 182.33333333333334,
- "r_x3": 443.3333333333333,
- "r_y3": 182.33333333333334,
+ "r_x0": 247.0,
+ "r_y0": 204.33333333333334,
+ "r_x1": 349.6666666666667,
+ "r_y1": 204.33333333333334,
+ "r_x2": 349.6666666666667,
+ "r_y2": 188.33333333333331,
+ "r_x3": 247.0,
+ "r_y3": 188.33333333333331,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.9639427899999999,
+ "confidence": 94.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 1,
+ "id": 8,
"label": "text",
"bbox": {
- "l": 175.0,
- "t": 228.66666666666669,
- "r": 225.66666666666669,
- "b": 237.33333333333331,
+ "l": 277.0,
+ "t": 220.0,
+ "r": 324.3333333333333,
+ "b": 236.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9129480123519897,
+ "confidence": 96.0,
"cells": [
{
"index": 7,
@@ -1190,22 +1185,37 @@
"a": 255
},
"rect": {
- "r_x0": 175.0,
- "r_y0": 237.33333333333331,
- "r_x1": 204.0,
- "r_y1": 237.33333333333331,
- "r_x2": 204.0,
- "r_y2": 228.66666666666669,
- "r_x3": 175.0,
- "r_y3": 228.66666666666669,
+ "r_x0": 277.0,
+ "r_y0": 236.0,
+ "r_x1": 324.3333333333333,
+ "r_y1": 236.0,
+ "r_x2": 324.3333333333333,
+ "r_y2": 220.0,
+ "r_x3": 277.0,
+ "r_y3": 220.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96050453,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 9,
+ "label": "text",
+ "bbox": {
+ "l": 247.0,
+ "t": 268.0,
+ "r": 349.6666666666667,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 92.0,
+ "cells": [
{
"index": 8,
"rgba": {
@@ -1215,36 +1225,36 @@
"a": 255
},
"rect": {
- "r_x0": 208.0,
- "r_y0": 237.33333333333331,
- "r_x1": 225.66666666666669,
- "r_y1": 237.33333333333331,
- "r_x2": 225.66666666666669,
- "r_y2": 231.0,
- "r_x3": 208.0,
- "r_y3": 231.0,
+ "r_x0": 247.0,
+ "r_y0": 284.0,
+ "r_x1": 349.6666666666667,
+ "r_y1": 284.0,
+ "r_x2": 349.6666666666667,
+ "r_y2": 268.0,
+ "r_x3": 247.0,
+ "r_y3": 268.0,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.9623416899999999,
+ "confidence": 92.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 2,
+ "id": 10,
"label": "text",
"bbox": {
- "l": 286.0,
- "t": 228.66666666666669,
- "r": 333.0,
- "b": 237.33333333333331,
+ "l": 277.0,
+ "t": 299.66666666666663,
+ "r": 324.3333333333333,
+ "b": 315.33333333333337,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9123309850692749,
+ "confidence": 96.0,
"cells": [
{
"index": 9,
@@ -1255,22 +1265,37 @@
"a": 255
},
"rect": {
- "r_x0": 286.0,
- "r_y0": 237.33333333333331,
- "r_x1": 313.0,
- "r_y1": 237.33333333333331,
- "r_x2": 313.0,
- "r_y2": 231.0,
- "r_x3": 286.0,
- "r_y3": 231.0,
+ "r_x0": 277.0,
+ "r_y0": 315.33333333333337,
+ "r_x1": 324.3333333333333,
+ "r_y1": 315.33333333333337,
+ "r_x2": 324.3333333333333,
+ "r_y2": 299.66666666666663,
+ "r_x3": 277.0,
+ "r_y3": 299.66666666666663,
"coord_origin": "TOPLEFT"
},
- "text": "some",
- "orig": "some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96279846,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 11,
+ "label": "text",
+ "bbox": {
+ "l": 406.3333333333333,
+ "t": 105.66666666666666,
+ "r": 518.3333333333333,
+ "b": 121.66666666666666,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
{
"index": 10,
"rgba": {
@@ -1280,36 +1305,36 @@
"a": 255
},
"rect": {
- "r_x0": 317.0,
- "r_y0": 237.33333333333331,
- "r_x1": 333.0,
- "r_y1": 237.33333333333331,
- "r_x2": 333.0,
- "r_y2": 228.66666666666669,
- "r_x3": 317.0,
- "r_y3": 228.66666666666669,
+ "r_x0": 406.3333333333333,
+ "r_y0": 121.66666666666666,
+ "r_x1": 518.3333333333333,
+ "r_y1": 121.66666666666666,
+ "r_x2": 518.3333333333333,
+ "r_y2": 105.66666666666666,
+ "r_x3": 406.3333333333333,
+ "r_y3": 105.66666666666666,
"coord_origin": "TOPLEFT"
},
- "text": "cell",
- "orig": "cell",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.96231712,
+ "confidence": 96.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 6,
+ "id": 12,
"label": "text",
"bbox": {
- "l": 398.3333333333333,
- "t": 228.66666666666669,
- "r": 463.0,
- "b": 237.33333333333331,
+ "l": 429.3333333333333,
+ "t": 137.0,
+ "r": 499.3333333333333,
+ "b": 153.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.8969476819038391,
+ "confidence": 94.0,
"cells": [
{
"index": 11,
@@ -1320,22 +1345,37 @@
"a": 255
},
"rect": {
- "r_x0": 398.3333333333333,
- "r_y0": 237.33333333333331,
- "r_x1": 422.0,
- "r_y1": 237.33333333333331,
- "r_x2": 422.0,
- "r_y2": 228.66666666666669,
- "r_x3": 398.3333333333333,
- "r_y3": 228.66666666666669,
+ "r_x0": 429.3333333333333,
+ "r_y0": 153.0,
+ "r_x1": 499.3333333333333,
+ "r_y1": 153.0,
+ "r_x2": 499.3333333333333,
+ "r_y2": 137.0,
+ "r_x3": 429.3333333333333,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.96670181,
+ "confidence": 94.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 13,
+ "label": "text",
+ "bbox": {
+ "l": 408.3333333333333,
+ "t": 188.33333333333331,
+ "r": 514.0,
+ "b": 204.33333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 12,
"rgba": {
@@ -1345,36 +1385,36 @@
"a": 255
},
"rect": {
- "r_x0": 426.0,
- "r_y0": 237.33333333333331,
- "r_x1": 463.0,
- "r_y1": 237.33333333333331,
- "r_x2": 463.0,
- "r_y2": 229.0,
- "r_x3": 426.0,
- "r_y3": 229.0,
+ "r_x0": 408.3333333333333,
+ "r_y0": 204.33333333333334,
+ "r_x1": 514.0,
+ "r_y1": 204.33333333333334,
+ "r_x2": 514.0,
+ "r_y2": 188.33333333333331,
+ "r_x3": 408.3333333333333,
+ "r_y3": 188.33333333333331,
"coord_origin": "TOPLEFT"
},
- "text": "content",
- "orig": "content",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.9589679700000001,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 0,
+ "id": 14,
"label": "text",
"bbox": {
- "l": 160.33333333333334,
- "t": 275.0,
- "r": 240.33333333333331,
- "b": 283.66666666666663,
+ "l": 440.6666666666667,
+ "t": 220.0,
+ "r": 487.6666666666667,
+ "b": 236.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9129647612571716,
+ "confidence": 95.0,
"cells": [
{
"index": 13,
@@ -1385,22 +1425,37 @@
"a": 255
},
"rect": {
- "r_x0": 160.33333333333334,
- "r_y0": 283.66666666666663,
- "r_x1": 189.33333333333331,
- "r_y1": 283.66666666666663,
- "r_x2": 189.33333333333331,
- "r_y2": 275.0,
- "r_x3": 160.33333333333334,
- "r_y3": 275.0,
+ "r_x0": 440.6666666666667,
+ "r_y0": 236.0,
+ "r_x1": 487.6666666666667,
+ "r_y1": 236.0,
+ "r_x2": 487.6666666666667,
+ "r_y2": 220.0,
+ "r_x3": 440.6666666666667,
+ "r_y3": 220.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.95674171,
+ "confidence": 95.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 15,
+ "label": "text",
+ "bbox": {
+ "l": 408.3333333333333,
+ "t": 268.0,
+ "r": 514.0,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 14,
"rgba": {
@@ -1410,22 +1465,37 @@
"a": 255
},
"rect": {
- "r_x0": 193.0,
- "r_y0": 283.66666666666663,
- "r_x1": 219.0,
- "r_y1": 283.66666666666663,
- "r_x2": 219.0,
- "r_y2": 275.0,
- "r_x3": 193.0,
- "r_y3": 275.0,
+ "r_x0": 408.3333333333333,
+ "r_y0": 284.0,
+ "r_x1": 514.0,
+ "r_y1": 284.0,
+ "r_x2": 514.0,
+ "r_y2": 268.0,
+ "r_x3": 408.3333333333333,
+ "r_y3": 268.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.9601168099999999,
+ "confidence": 95.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 16,
+ "label": "text",
+ "bbox": {
+ "l": 440.6666666666667,
+ "t": 299.66666666666663,
+ "r": 487.6666666666667,
+ "b": 315.33333333333337,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 15,
"rgba": {
@@ -1435,85 +1505,20 @@
"a": 255
},
"rect": {
- "r_x0": 222.66666666666669,
- "r_y0": 283.66666666666663,
- "r_x1": 240.33333333333331,
- "r_y1": 283.66666666666663,
- "r_x2": 240.33333333333331,
- "r_y2": 277.33333333333337,
- "r_x3": 222.66666666666669,
- "r_y3": 277.33333333333337,
+ "r_x0": 440.6666666666667,
+ "r_y0": 315.33333333333337,
+ "r_x1": 487.6666666666667,
+ "r_y1": 315.33333333333337,
+ "r_x2": 487.6666666666667,
+ "r_y2": 299.66666666666663,
+ "r_x3": 440.6666666666667,
+ "r_y3": 299.66666666666663,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96364174,
- "from_ocr": true
- }
- ],
- "children": []
- },
- {
- "id": 3,
- "label": "text",
- "bbox": {
- "l": 283.0,
- "t": 275.0,
- "r": 336.33333333333337,
- "b": 283.66666666666663,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.9102913737297058,
- "cells": [
- {
- "index": 16,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 283.0,
- "r_y0": 283.66666666666663,
- "r_x1": 309.0,
- "r_y1": 283.66666666666663,
- "r_x2": 309.0,
- "r_y2": 275.0,
- "r_x3": 283.0,
- "r_y3": 275.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.9636872099999999,
- "from_ocr": true
- },
- {
- "index": 17,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 312.33333333333337,
- "r_y0": 283.66666666666663,
- "r_x1": 336.33333333333337,
- "r_y1": 283.66666666666663,
- "r_x2": 336.33333333333337,
- "r_y2": 275.0,
- "r_x3": 312.33333333333337,
- "r_y3": 275.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "don't",
- "orig": "don't",
- "text_direction": "left_to_right",
- "confidence": 0.9636872099999999,
+ "confidence": 95.0,
"from_ocr": true
}
],
@@ -1524,7 +1529,1259 @@
]
},
"tablestructure": {
- "table_map": {}
+ "table_map": {
+ "0": {
+ "label": "table",
+ "id": 0,
+ "page_no": 0,
+ "cluster": {
+ "id": 0,
+ "label": "table",
+ "bbox": {
+ "l": 69.04969024658203,
+ "t": 87.64955139160156,
+ "r": 551.0990600585938,
+ "b": 334.58026123046875,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 0.9790865778923035,
+ "cells": [
+ {
+ "index": 0,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 97.33333333333333,
+ "r_y0": 126.33333333333334,
+ "r_x1": 190.0,
+ "r_y1": 126.33333333333334,
+ "r_x2": 190.0,
+ "r_y2": 105.66666666666666,
+ "r_x3": 97.33333333333333,
+ "r_y3": 105.66666666666666,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Vertically",
+ "orig": "Vertically",
+ "text_direction": "left_to_right",
+ "confidence": 89.0,
+ "from_ocr": true
+ },
+ {
+ "index": 1,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 112.0,
+ "r_y0": 157.66666666666669,
+ "r_x1": 182.33333333333334,
+ "r_y1": 157.66666666666669,
+ "r_x2": 182.33333333333334,
+ "r_y2": 137.0,
+ "r_x3": 112.0,
+ "r_y3": 137.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "merged",
+ "orig": "merged",
+ "text_direction": "left_to_right",
+ "confidence": 92.0,
+ "from_ocr": true
+ },
+ {
+ "index": 2,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 121.66666666666667,
+ "r_y0": 220.0,
+ "r_x1": 168.66666666666666,
+ "r_y1": 220.0,
+ "r_x2": 168.66666666666666,
+ "r_y2": 204.33333333333334,
+ "r_x3": 121.66666666666667,
+ "r_y3": 204.33333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ },
+ {
+ "index": 3,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 121.66666666666667,
+ "r_y0": 300.0,
+ "r_x1": 168.66666666666666,
+ "r_y1": 300.0,
+ "r_x2": 168.66666666666666,
+ "r_y2": 284.0,
+ "r_x3": 121.66666666666667,
+ "r_y3": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ },
+ {
+ "index": 4,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 232.66666666666666,
+ "r_y0": 126.33333333333334,
+ "r_x1": 364.0,
+ "r_y1": 126.33333333333334,
+ "r_x2": 364.0,
+ "r_y2": 105.66666666666666,
+ "r_x3": 232.66666666666666,
+ "r_y3": 105.66666666666666,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Other merged",
+ "orig": "Other merged",
+ "text_direction": "left_to_right",
+ "confidence": 92.0,
+ "from_ocr": true
+ },
+ {
+ "index": 5,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 265.66666666666663,
+ "r_y0": 153.0,
+ "r_x1": 336.0,
+ "r_y1": 153.0,
+ "r_x2": 336.0,
+ "r_y2": 137.0,
+ "r_x3": 265.66666666666663,
+ "r_y3": 137.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "column",
+ "orig": "column",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ },
+ {
+ "index": 6,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 247.0,
+ "r_y0": 204.33333333333334,
+ "r_x1": 349.6666666666667,
+ "r_y1": 204.33333333333334,
+ "r_x2": 349.6666666666667,
+ "r_y2": 188.33333333333331,
+ "r_x3": 247.0,
+ "r_y3": 188.33333333333331,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Some other",
+ "orig": "Some other",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ },
+ {
+ "index": 7,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 277.0,
+ "r_y0": 236.0,
+ "r_x1": 324.3333333333333,
+ "r_y1": 236.0,
+ "r_x2": 324.3333333333333,
+ "r_y2": 220.0,
+ "r_x3": 277.0,
+ "r_y3": 220.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ },
+ {
+ "index": 8,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 247.0,
+ "r_y0": 284.0,
+ "r_x1": 349.6666666666667,
+ "r_y1": 284.0,
+ "r_x2": 349.6666666666667,
+ "r_y2": 268.0,
+ "r_x3": 247.0,
+ "r_y3": 268.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Some other",
+ "orig": "Some other",
+ "text_direction": "left_to_right",
+ "confidence": 92.0,
+ "from_ocr": true
+ },
+ {
+ "index": 9,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 277.0,
+ "r_y0": 315.33333333333337,
+ "r_x1": 324.3333333333333,
+ "r_y1": 315.33333333333337,
+ "r_x2": 324.3333333333333,
+ "r_y2": 299.66666666666663,
+ "r_x3": 277.0,
+ "r_y3": 299.66666666666663,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ },
+ {
+ "index": 10,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 406.3333333333333,
+ "r_y0": 121.66666666666666,
+ "r_x1": 518.3333333333333,
+ "r_y1": 121.66666666666666,
+ "r_x2": 518.3333333333333,
+ "r_y2": 105.66666666666666,
+ "r_x3": 406.3333333333333,
+ "r_y3": 105.66666666666666,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ },
+ {
+ "index": 11,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 429.3333333333333,
+ "r_y0": 153.0,
+ "r_x1": 499.3333333333333,
+ "r_y1": 153.0,
+ "r_x2": 499.3333333333333,
+ "r_y2": 137.0,
+ "r_x3": 429.3333333333333,
+ "r_y3": 137.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "column",
+ "orig": "column",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ },
+ {
+ "index": 12,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 408.3333333333333,
+ "r_y0": 204.33333333333334,
+ "r_x1": 514.0,
+ "r_y1": 204.33333333333334,
+ "r_x2": 514.0,
+ "r_y2": 188.33333333333331,
+ "r_x3": 408.3333333333333,
+ "r_y3": 188.33333333333331,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 440.6666666666667,
+ "r_y0": 236.0,
+ "r_x1": 487.6666666666667,
+ "r_y1": 236.0,
+ "r_x2": 487.6666666666667,
+ "r_y2": 220.0,
+ "r_x3": 440.6666666666667,
+ "r_y3": 220.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 408.3333333333333,
+ "r_y0": 284.0,
+ "r_x1": 514.0,
+ "r_y1": 284.0,
+ "r_x2": 514.0,
+ "r_y2": 268.0,
+ "r_x3": 408.3333333333333,
+ "r_y3": 268.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 440.6666666666667,
+ "r_y0": 315.33333333333337,
+ "r_x1": 487.6666666666667,
+ "r_y1": 315.33333333333337,
+ "r_x2": 487.6666666666667,
+ "r_y2": 299.66666666666663,
+ "r_x3": 440.6666666666667,
+ "r_y3": 299.66666666666663,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": [
+ {
+ "id": 1,
+ "label": "text",
+ "bbox": {
+ "l": 97.33333333333333,
+ "t": 105.66666666666666,
+ "r": 190.0,
+ "b": 126.33333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 89.0,
+ "cells": [
+ {
+ "index": 0,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 97.33333333333333,
+ "r_y0": 126.33333333333334,
+ "r_x1": 190.0,
+ "r_y1": 126.33333333333334,
+ "r_x2": 190.0,
+ "r_y2": 105.66666666666666,
+ "r_x3": 97.33333333333333,
+ "r_y3": 105.66666666666666,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Vertically",
+ "orig": "Vertically",
+ "text_direction": "left_to_right",
+ "confidence": 89.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 2,
+ "label": "text",
+ "bbox": {
+ "l": 112.0,
+ "t": 137.0,
+ "r": 182.33333333333334,
+ "b": 157.66666666666669,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 92.0,
+ "cells": [
+ {
+ "index": 1,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 112.0,
+ "r_y0": 157.66666666666669,
+ "r_x1": 182.33333333333334,
+ "r_y1": 157.66666666666669,
+ "r_x2": 182.33333333333334,
+ "r_y2": 137.0,
+ "r_x3": 112.0,
+ "r_y3": 137.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "merged",
+ "orig": "merged",
+ "text_direction": "left_to_right",
+ "confidence": 92.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 3,
+ "label": "text",
+ "bbox": {
+ "l": 121.66666666666667,
+ "t": 204.33333333333334,
+ "r": 168.66666666666666,
+ "b": 220.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
+ {
+ "index": 2,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 121.66666666666667,
+ "r_y0": 220.0,
+ "r_x1": 168.66666666666666,
+ "r_y1": 220.0,
+ "r_x2": 168.66666666666666,
+ "r_y2": 204.33333333333334,
+ "r_x3": 121.66666666666667,
+ "r_y3": 204.33333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 4,
+ "label": "text",
+ "bbox": {
+ "l": 121.66666666666667,
+ "t": 284.0,
+ "r": 168.66666666666666,
+ "b": 300.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
+ {
+ "index": 3,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 121.66666666666667,
+ "r_y0": 300.0,
+ "r_x1": 168.66666666666666,
+ "r_y1": 300.0,
+ "r_x2": 168.66666666666666,
+ "r_y2": 284.0,
+ "r_x3": 121.66666666666667,
+ "r_y3": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 5,
+ "label": "text",
+ "bbox": {
+ "l": 232.66666666666666,
+ "t": 105.66666666666666,
+ "r": 364.0,
+ "b": 126.33333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 92.0,
+ "cells": [
+ {
+ "index": 4,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 232.66666666666666,
+ "r_y0": 126.33333333333334,
+ "r_x1": 364.0,
+ "r_y1": 126.33333333333334,
+ "r_x2": 364.0,
+ "r_y2": 105.66666666666666,
+ "r_x3": 232.66666666666666,
+ "r_y3": 105.66666666666666,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Other merged",
+ "orig": "Other merged",
+ "text_direction": "left_to_right",
+ "confidence": 92.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 6,
+ "label": "text",
+ "bbox": {
+ "l": 265.66666666666663,
+ "t": 137.0,
+ "r": 336.0,
+ "b": 153.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
+ {
+ "index": 5,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 265.66666666666663,
+ "r_y0": 153.0,
+ "r_x1": 336.0,
+ "r_y1": 153.0,
+ "r_x2": 336.0,
+ "r_y2": 137.0,
+ "r_x3": 265.66666666666663,
+ "r_y3": 137.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "column",
+ "orig": "column",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 7,
+ "label": "text",
+ "bbox": {
+ "l": 247.0,
+ "t": 188.33333333333331,
+ "r": 349.6666666666667,
+ "b": 204.33333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
+ {
+ "index": 6,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 247.0,
+ "r_y0": 204.33333333333334,
+ "r_x1": 349.6666666666667,
+ "r_y1": 204.33333333333334,
+ "r_x2": 349.6666666666667,
+ "r_y2": 188.33333333333331,
+ "r_x3": 247.0,
+ "r_y3": 188.33333333333331,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Some other",
+ "orig": "Some other",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 8,
+ "label": "text",
+ "bbox": {
+ "l": 277.0,
+ "t": 220.0,
+ "r": 324.3333333333333,
+ "b": 236.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
+ {
+ "index": 7,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 277.0,
+ "r_y0": 236.0,
+ "r_x1": 324.3333333333333,
+ "r_y1": 236.0,
+ "r_x2": 324.3333333333333,
+ "r_y2": 220.0,
+ "r_x3": 277.0,
+ "r_y3": 220.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 9,
+ "label": "text",
+ "bbox": {
+ "l": 247.0,
+ "t": 268.0,
+ "r": 349.6666666666667,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 92.0,
+ "cells": [
+ {
+ "index": 8,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 247.0,
+ "r_y0": 284.0,
+ "r_x1": 349.6666666666667,
+ "r_y1": 284.0,
+ "r_x2": 349.6666666666667,
+ "r_y2": 268.0,
+ "r_x3": 247.0,
+ "r_y3": 268.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Some other",
+ "orig": "Some other",
+ "text_direction": "left_to_right",
+ "confidence": 92.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 10,
+ "label": "text",
+ "bbox": {
+ "l": 277.0,
+ "t": 299.66666666666663,
+ "r": 324.3333333333333,
+ "b": 315.33333333333337,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
+ {
+ "index": 9,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 277.0,
+ "r_y0": 315.33333333333337,
+ "r_x1": 324.3333333333333,
+ "r_y1": 315.33333333333337,
+ "r_x2": 324.3333333333333,
+ "r_y2": 299.66666666666663,
+ "r_x3": 277.0,
+ "r_y3": 299.66666666666663,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 11,
+ "label": "text",
+ "bbox": {
+ "l": 406.3333333333333,
+ "t": 105.66666666666666,
+ "r": 518.3333333333333,
+ "b": 121.66666666666666,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
+ {
+ "index": 10,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 406.3333333333333,
+ "r_y0": 121.66666666666666,
+ "r_x1": 518.3333333333333,
+ "r_y1": 121.66666666666666,
+ "r_x2": 518.3333333333333,
+ "r_y2": 105.66666666666666,
+ "r_x3": 406.3333333333333,
+ "r_y3": 105.66666666666666,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 12,
+ "label": "text",
+ "bbox": {
+ "l": 429.3333333333333,
+ "t": 137.0,
+ "r": 499.3333333333333,
+ "b": 153.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
+ {
+ "index": 11,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 429.3333333333333,
+ "r_y0": 153.0,
+ "r_x1": 499.3333333333333,
+ "r_y1": 153.0,
+ "r_x2": 499.3333333333333,
+ "r_y2": 137.0,
+ "r_x3": 429.3333333333333,
+ "r_y3": 137.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "column",
+ "orig": "column",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 13,
+ "label": "text",
+ "bbox": {
+ "l": 408.3333333333333,
+ "t": 188.33333333333331,
+ "r": 514.0,
+ "b": 204.33333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 12,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 408.3333333333333,
+ "r_y0": 204.33333333333334,
+ "r_x1": 514.0,
+ "r_y1": 204.33333333333334,
+ "r_x2": 514.0,
+ "r_y2": 188.33333333333331,
+ "r_x3": 408.3333333333333,
+ "r_y3": 188.33333333333331,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 14,
+ "label": "text",
+ "bbox": {
+ "l": 440.6666666666667,
+ "t": 220.0,
+ "r": 487.6666666666667,
+ "b": 236.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 440.6666666666667,
+ "r_y0": 236.0,
+ "r_x1": 487.6666666666667,
+ "r_y1": 236.0,
+ "r_x2": 487.6666666666667,
+ "r_y2": 220.0,
+ "r_x3": 440.6666666666667,
+ "r_y3": 220.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 15,
+ "label": "text",
+ "bbox": {
+ "l": 408.3333333333333,
+ "t": 268.0,
+ "r": 514.0,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 408.3333333333333,
+ "r_y0": 284.0,
+ "r_x1": 514.0,
+ "r_y1": 284.0,
+ "r_x2": 514.0,
+ "r_y2": 268.0,
+ "r_x3": 408.3333333333333,
+ "r_y3": 268.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 16,
+ "label": "text",
+ "bbox": {
+ "l": 440.6666666666667,
+ "t": 299.66666666666663,
+ "r": 487.6666666666667,
+ "b": 315.33333333333337,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 440.6666666666667,
+ "r_y0": 315.33333333333337,
+ "r_x1": 487.6666666666667,
+ "r_y1": 315.33333333333337,
+ "r_x2": 487.6666666666667,
+ "r_y2": 299.66666666666663,
+ "r_x3": 440.6666666666667,
+ "r_y3": 299.66666666666663,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ }
+ ]
+ },
+ "text": null,
+ "otsl_seq": [
+ "ched",
+ "ched",
+ "ched",
+ "nl",
+ "fcel",
+ "fcel",
+ "fcel",
+ "nl",
+ "fcel",
+ "fcel",
+ "fcel",
+ "nl"
+ ],
+ "num_rows": 3,
+ "num_cols": 3,
+ "table_cells": [
+ {
+ "bbox": {
+ "l": 97.33333333333333,
+ "t": 105.66666666666666,
+ "r": 190.0,
+ "b": 126.33333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 0,
+ "end_col_offset_idx": 1,
+ "text": "Vertically merged",
+ "column_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 121.66666666666667,
+ "t": 204.33333333333334,
+ "r": 168.66666666666666,
+ "b": 220.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 0,
+ "end_col_offset_idx": 1,
+ "text": "value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 121.66666666666667,
+ "t": 284.0,
+ "r": 168.66666666666666,
+ "b": 300.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 2,
+ "end_row_offset_idx": 3,
+ "start_col_offset_idx": 0,
+ "end_col_offset_idx": 1,
+ "text": "value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 232.66666666666666,
+ "t": 105.66666666666666,
+ "r": 364.0,
+ "b": 126.33333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Other merged column",
+ "column_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 247.0,
+ "t": 188.33333333333331,
+ "r": 349.6666666666667,
+ "b": 204.33333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Some other value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 247.0,
+ "t": 268.0,
+ "r": 349.6666666666667,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 2,
+ "end_row_offset_idx": 3,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Some other value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 406.3333333333333,
+ "t": 105.66666666666666,
+ "r": 518.3333333333333,
+ "b": 121.66666666666666,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another column",
+ "column_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 408.3333333333333,
+ "t": 188.33333333333331,
+ "r": 514.0,
+ "b": 204.33333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 408.3333333333333,
+ "t": 268.0,
+ "r": 514.0,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 2,
+ "end_row_offset_idx": 3,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ }
+ ]
+ }
+ }
},
"figures_classification": null,
"equations_prediction": null,
@@ -1533,20 +2790,20 @@
"assembled": {
"elements": [
{
- "label": "section_header",
- "id": 9,
+ "label": "table",
+ "id": 0,
"page_no": 0,
"cluster": {
- "id": 9,
- "label": "section_header",
+ "id": 0,
+ "label": "table",
"bbox": {
- "l": 201.26343,
- "t": 72.85059000000001,
- "r": 417.96021,
- "b": 101.89746000000002,
+ "l": 69.04969024658203,
+ "t": 87.64955139160156,
+ "r": 551.0990600585938,
+ "b": 334.58026123046875,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.6777006387710571,
+ "confidence": 0.9790865778923035,
"cells": [
{
"index": 0,
@@ -1557,43 +2814,22 @@
"a": 255
},
"rect": {
- "r_x0": 201.26343,
- "r_y0": 101.89746000000002,
- "r_x1": 417.96021,
- "r_y1": 101.89746000000002,
- "r_x2": 417.96021,
- "r_y2": 72.85059000000001,
- "r_x3": 201.26343,
- "r_y3": 72.85059000000001,
+ "r_x0": 97.33333333333333,
+ "r_y0": 126.33333333333334,
+ "r_x1": 190.0,
+ "r_y1": 126.33333333333334,
+ "r_x2": 190.0,
+ "r_y2": 105.66666666666666,
+ "r_x3": 97.33333333333333,
+ "r_y3": 105.66666666666666,
"coord_origin": "TOPLEFT"
},
- "text": "This is a table test ",
- "orig": "This is a table test ",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- }
- ],
- "children": []
- },
- "text": "This is a table test"
- },
- {
- "label": "text",
- "id": 7,
- "page_no": 0,
- "cluster": {
- "id": 7,
- "label": "text",
- "bbox": {
- "l": 72.0,
- "t": 124.28821000000016,
- "r": 376.27319,
- "b": 136.57727,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.8428522944450378,
- "cells": [
+ "confidence": 89.0,
+ "from_ocr": true
+ },
{
"index": 1,
"rgba": {
@@ -1603,43 +2839,22 @@
"a": 255
},
"rect": {
- "r_x0": 72.0,
- "r_y0": 136.57727,
- "r_x1": 376.27319,
- "r_y1": 136.57727,
- "r_x2": 376.27319,
- "r_y2": 124.28821000000016,
- "r_x3": 72.0,
- "r_y3": 124.28821000000016,
+ "r_x0": 112.0,
+ "r_y0": 157.66666666666669,
+ "r_x1": 182.33333333333334,
+ "r_y1": 157.66666666666669,
+ "r_x2": 182.33333333333334,
+ "r_y2": 137.0,
+ "r_x3": 112.0,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "The test starts with some random text and then a table image: ",
- "orig": "The test starts with some random text and then a table image: ",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- }
- ],
- "children": []
- },
- "text": "The test starts with some random text and then a table image:"
- },
- {
- "label": "form",
- "id": 8,
- "page_no": 0,
- "cluster": {
- "id": 8,
- "label": "form",
- "bbox": {
- "l": 160.33333333333334,
- "t": 182.33333333333334,
- "r": 479.3333333333333,
- "b": 283.66666666666663,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.7274590134620667,
- "cells": [
+ "confidence": 92.0,
+ "from_ocr": true
+ },
{
"index": 2,
"rgba": {
@@ -1649,20 +2864,20 @@
"a": 255
},
"rect": {
- "r_x0": 275.33333333333337,
- "r_y0": 191.0,
- "r_x1": 304.0,
- "r_y1": 191.0,
- "r_x2": 304.0,
- "r_y2": 182.33333333333334,
- "r_x3": 275.33333333333337,
- "r_y3": 182.33333333333334,
+ "r_x0": 121.66666666666667,
+ "r_y0": 220.0,
+ "r_x1": 168.66666666666666,
+ "r_y1": 220.0,
+ "r_x2": 168.66666666666666,
+ "r_y2": 204.33333333333334,
+ "r_x3": 121.66666666666667,
+ "r_y3": 204.33333333333334,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9609484899999999,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -1674,20 +2889,20 @@
"a": 255
},
"rect": {
- "r_x0": 308.0,
- "r_y0": 191.0,
- "r_x1": 343.66666666666663,
- "r_y1": 191.0,
- "r_x2": 343.66666666666663,
- "r_y2": 182.33333333333334,
- "r_x3": 308.0,
- "r_y3": 182.33333333333334,
+ "r_x0": 121.66666666666667,
+ "r_y0": 300.0,
+ "r_x1": 168.66666666666666,
+ "r_y1": 300.0,
+ "r_x2": 168.66666666666666,
+ "r_y2": 284.0,
+ "r_x3": 121.66666666666667,
+ "r_y3": 284.0,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.95935837,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -1699,20 +2914,20 @@
"a": 255
},
"rect": {
- "r_x0": 381.3333333333333,
- "r_y0": 191.0,
- "r_x1": 410.3333333333333,
- "r_y1": 191.0,
- "r_x2": 410.3333333333333,
- "r_y2": 182.33333333333334,
- "r_x3": 381.3333333333333,
- "r_y3": 182.33333333333334,
+ "r_x0": 232.66666666666666,
+ "r_y0": 126.33333333333334,
+ "r_x1": 364.0,
+ "r_y1": 126.33333333333334,
+ "r_x2": 364.0,
+ "r_y2": 105.66666666666666,
+ "r_x3": 232.66666666666666,
+ "r_y3": 105.66666666666666,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 0.95280136,
+ "confidence": 92.0,
"from_ocr": true
},
{
@@ -1724,20 +2939,20 @@
"a": 255
},
"rect": {
- "r_x0": 414.3333333333333,
- "r_y0": 191.0,
- "r_x1": 440.3333333333333,
- "r_y1": 191.0,
- "r_x2": 440.3333333333333,
- "r_y2": 182.33333333333334,
- "r_x3": 414.3333333333333,
- "r_y3": 182.33333333333334,
+ "r_x0": 265.66666666666663,
+ "r_y0": 153.0,
+ "r_x1": 336.0,
+ "r_y1": 153.0,
+ "r_x2": 336.0,
+ "r_y2": 137.0,
+ "r_x3": 265.66666666666663,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9649115,
+ "confidence": 94.0,
"from_ocr": true
},
{
@@ -1749,20 +2964,20 @@
"a": 255
},
"rect": {
- "r_x0": 443.3333333333333,
- "r_y0": 191.0,
- "r_x1": 479.3333333333333,
- "r_y1": 191.0,
- "r_x2": 479.3333333333333,
- "r_y2": 182.33333333333334,
- "r_x3": 443.3333333333333,
- "r_y3": 182.33333333333334,
+ "r_x0": 247.0,
+ "r_y0": 204.33333333333334,
+ "r_x1": 349.6666666666667,
+ "r_y1": 204.33333333333334,
+ "r_x2": 349.6666666666667,
+ "r_y2": 188.33333333333331,
+ "r_x3": 247.0,
+ "r_y3": 188.33333333333331,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.9639427899999999,
+ "confidence": 94.0,
"from_ocr": true
},
{
@@ -1774,20 +2989,20 @@
"a": 255
},
"rect": {
- "r_x0": 175.0,
- "r_y0": 237.33333333333331,
- "r_x1": 204.0,
- "r_y1": 237.33333333333331,
- "r_x2": 204.0,
- "r_y2": 228.66666666666669,
- "r_x3": 175.0,
- "r_y3": 228.66666666666669,
+ "r_x0": 277.0,
+ "r_y0": 236.0,
+ "r_x1": 324.3333333333333,
+ "r_y1": 236.0,
+ "r_x2": 324.3333333333333,
+ "r_y2": 220.0,
+ "r_x3": 277.0,
+ "r_y3": 220.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96050453,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -1799,20 +3014,20 @@
"a": 255
},
"rect": {
- "r_x0": 208.0,
- "r_y0": 237.33333333333331,
- "r_x1": 225.66666666666669,
- "r_y1": 237.33333333333331,
- "r_x2": 225.66666666666669,
- "r_y2": 231.0,
- "r_x3": 208.0,
- "r_y3": 231.0,
+ "r_x0": 247.0,
+ "r_y0": 284.0,
+ "r_x1": 349.6666666666667,
+ "r_y1": 284.0,
+ "r_x2": 349.6666666666667,
+ "r_y2": 268.0,
+ "r_x3": 247.0,
+ "r_y3": 268.0,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.9623416899999999,
+ "confidence": 92.0,
"from_ocr": true
},
{
@@ -1824,20 +3039,20 @@
"a": 255
},
"rect": {
- "r_x0": 286.0,
- "r_y0": 237.33333333333331,
- "r_x1": 313.0,
- "r_y1": 237.33333333333331,
- "r_x2": 313.0,
- "r_y2": 231.0,
- "r_x3": 286.0,
- "r_y3": 231.0,
+ "r_x0": 277.0,
+ "r_y0": 315.33333333333337,
+ "r_x1": 324.3333333333333,
+ "r_y1": 315.33333333333337,
+ "r_x2": 324.3333333333333,
+ "r_y2": 299.66666666666663,
+ "r_x3": 277.0,
+ "r_y3": 299.66666666666663,
"coord_origin": "TOPLEFT"
},
- "text": "some",
- "orig": "some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96279846,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -1849,20 +3064,20 @@
"a": 255
},
"rect": {
- "r_x0": 317.0,
- "r_y0": 237.33333333333331,
- "r_x1": 333.0,
- "r_y1": 237.33333333333331,
- "r_x2": 333.0,
- "r_y2": 228.66666666666669,
- "r_x3": 317.0,
- "r_y3": 228.66666666666669,
+ "r_x0": 406.3333333333333,
+ "r_y0": 121.66666666666666,
+ "r_x1": 518.3333333333333,
+ "r_y1": 121.66666666666666,
+ "r_x2": 518.3333333333333,
+ "r_y2": 105.66666666666666,
+ "r_x3": 406.3333333333333,
+ "r_y3": 105.66666666666666,
"coord_origin": "TOPLEFT"
},
- "text": "cell",
- "orig": "cell",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.96231712,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -1874,20 +3089,20 @@
"a": 255
},
"rect": {
- "r_x0": 398.3333333333333,
- "r_y0": 237.33333333333331,
- "r_x1": 422.0,
- "r_y1": 237.33333333333331,
- "r_x2": 422.0,
- "r_y2": 228.66666666666669,
- "r_x3": 398.3333333333333,
- "r_y3": 228.66666666666669,
+ "r_x0": 429.3333333333333,
+ "r_y0": 153.0,
+ "r_x1": 499.3333333333333,
+ "r_y1": 153.0,
+ "r_x2": 499.3333333333333,
+ "r_y2": 137.0,
+ "r_x3": 429.3333333333333,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.96670181,
+ "confidence": 94.0,
"from_ocr": true
},
{
@@ -1899,20 +3114,20 @@
"a": 255
},
"rect": {
- "r_x0": 426.0,
- "r_y0": 237.33333333333331,
- "r_x1": 463.0,
- "r_y1": 237.33333333333331,
- "r_x2": 463.0,
- "r_y2": 229.0,
- "r_x3": 426.0,
- "r_y3": 229.0,
+ "r_x0": 408.3333333333333,
+ "r_y0": 204.33333333333334,
+ "r_x1": 514.0,
+ "r_y1": 204.33333333333334,
+ "r_x2": 514.0,
+ "r_y2": 188.33333333333331,
+ "r_x3": 408.3333333333333,
+ "r_y3": 188.33333333333331,
"coord_origin": "TOPLEFT"
},
- "text": "content",
- "orig": "content",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.9589679700000001,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -1924,20 +3139,20 @@
"a": 255
},
"rect": {
- "r_x0": 160.33333333333334,
- "r_y0": 283.66666666666663,
- "r_x1": 189.33333333333331,
- "r_y1": 283.66666666666663,
- "r_x2": 189.33333333333331,
- "r_y2": 275.0,
- "r_x3": 160.33333333333334,
- "r_y3": 275.0,
+ "r_x0": 440.6666666666667,
+ "r_y0": 236.0,
+ "r_x1": 487.6666666666667,
+ "r_y1": 236.0,
+ "r_x2": 487.6666666666667,
+ "r_y2": 220.0,
+ "r_x3": 440.6666666666667,
+ "r_y3": 220.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.95674171,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -1949,20 +3164,20 @@
"a": 255
},
"rect": {
- "r_x0": 193.0,
- "r_y0": 283.66666666666663,
- "r_x1": 219.0,
- "r_y1": 283.66666666666663,
- "r_x2": 219.0,
- "r_y2": 275.0,
- "r_x3": 193.0,
- "r_y3": 275.0,
+ "r_x0": 408.3333333333333,
+ "r_y0": 284.0,
+ "r_x1": 514.0,
+ "r_y1": 284.0,
+ "r_x2": 514.0,
+ "r_y2": 268.0,
+ "r_x3": 408.3333333333333,
+ "r_y3": 268.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.9601168099999999,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -1974,85 +3189,115 @@
"a": 255
},
"rect": {
- "r_x0": 222.66666666666669,
- "r_y0": 283.66666666666663,
- "r_x1": 240.33333333333331,
- "r_y1": 283.66666666666663,
- "r_x2": 240.33333333333331,
- "r_y2": 277.33333333333337,
- "r_x3": 222.66666666666669,
- "r_y3": 277.33333333333337,
+ "r_x0": 440.6666666666667,
+ "r_y0": 315.33333333333337,
+ "r_x1": 487.6666666666667,
+ "r_y1": 315.33333333333337,
+ "r_x2": 487.6666666666667,
+ "r_y2": 299.66666666666663,
+ "r_x3": 440.6666666666667,
+ "r_y3": 299.66666666666663,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96364174,
- "from_ocr": true
- },
- {
- "index": 16,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 283.0,
- "r_y0": 283.66666666666663,
- "r_x1": 309.0,
- "r_y1": 283.66666666666663,
- "r_x2": 309.0,
- "r_y2": 275.0,
- "r_x3": 283.0,
- "r_y3": 275.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.9636872099999999,
- "from_ocr": true
- },
- {
- "index": 17,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 312.33333333333337,
- "r_y0": 283.66666666666663,
- "r_x1": 336.33333333333337,
- "r_y1": 283.66666666666663,
- "r_x2": 336.33333333333337,
- "r_y2": 275.0,
- "r_x3": 312.33333333333337,
- "r_y3": 275.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "don't",
- "orig": "don't",
- "text_direction": "left_to_right",
- "confidence": 0.9636872099999999,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": [
{
- "id": 4,
+ "id": 1,
"label": "text",
"bbox": {
- "l": 275.33333333333337,
- "t": 182.33333333333334,
- "r": 343.66666666666663,
- "b": 191.0,
+ "l": 97.33333333333333,
+ "t": 105.66666666666666,
+ "r": 190.0,
+ "b": 126.33333333333334,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9056976437568665,
+ "confidence": 89.0,
+ "cells": [
+ {
+ "index": 0,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 97.33333333333333,
+ "r_y0": 126.33333333333334,
+ "r_x1": 190.0,
+ "r_y1": 126.33333333333334,
+ "r_x2": 190.0,
+ "r_y2": 105.66666666666666,
+ "r_x3": 97.33333333333333,
+ "r_y3": 105.66666666666666,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Vertically",
+ "orig": "Vertically",
+ "text_direction": "left_to_right",
+ "confidence": 89.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 2,
+ "label": "text",
+ "bbox": {
+ "l": 112.0,
+ "t": 137.0,
+ "r": 182.33333333333334,
+ "b": 157.66666666666669,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 92.0,
+ "cells": [
+ {
+ "index": 1,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 112.0,
+ "r_y0": 157.66666666666669,
+ "r_x1": 182.33333333333334,
+ "r_y1": 157.66666666666669,
+ "r_x2": 182.33333333333334,
+ "r_y2": 137.0,
+ "r_x3": 112.0,
+ "r_y3": 137.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "merged",
+ "orig": "merged",
+ "text_direction": "left_to_right",
+ "confidence": 92.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 3,
+ "label": "text",
+ "bbox": {
+ "l": 121.66666666666667,
+ "t": 204.33333333333334,
+ "r": 168.66666666666666,
+ "b": 220.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
"cells": [
{
"index": 2,
@@ -2063,22 +3308,37 @@
"a": 255
},
"rect": {
- "r_x0": 275.33333333333337,
- "r_y0": 191.0,
- "r_x1": 304.0,
- "r_y1": 191.0,
- "r_x2": 304.0,
- "r_y2": 182.33333333333334,
- "r_x3": 275.33333333333337,
- "r_y3": 182.33333333333334,
+ "r_x0": 121.66666666666667,
+ "r_y0": 220.0,
+ "r_x1": 168.66666666666666,
+ "r_y1": 220.0,
+ "r_x2": 168.66666666666666,
+ "r_y2": 204.33333333333334,
+ "r_x3": 121.66666666666667,
+ "r_y3": 204.33333333333334,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9609484899999999,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 4,
+ "label": "text",
+ "bbox": {
+ "l": 121.66666666666667,
+ "t": 284.0,
+ "r": 168.66666666666666,
+ "b": 300.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
{
"index": 3,
"rgba": {
@@ -2088,20 +3348,20 @@
"a": 255
},
"rect": {
- "r_x0": 308.0,
- "r_y0": 191.0,
- "r_x1": 343.66666666666663,
- "r_y1": 191.0,
- "r_x2": 343.66666666666663,
- "r_y2": 182.33333333333334,
- "r_x3": 308.0,
- "r_y3": 182.33333333333334,
+ "r_x0": 121.66666666666667,
+ "r_y0": 300.0,
+ "r_x1": 168.66666666666666,
+ "r_y1": 300.0,
+ "r_x2": 168.66666666666666,
+ "r_y2": 284.0,
+ "r_x3": 121.66666666666667,
+ "r_y3": 284.0,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.95935837,
+ "confidence": 96.0,
"from_ocr": true
}
],
@@ -2111,13 +3371,13 @@
"id": 5,
"label": "text",
"bbox": {
- "l": 381.3333333333333,
- "t": 182.33333333333334,
- "r": 479.3333333333333,
- "b": 191.0,
+ "l": 232.66666666666666,
+ "t": 105.66666666666666,
+ "r": 364.0,
+ "b": 126.33333333333334,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9007152318954468,
+ "confidence": 92.0,
"cells": [
{
"index": 4,
@@ -2128,22 +3388,37 @@
"a": 255
},
"rect": {
- "r_x0": 381.3333333333333,
- "r_y0": 191.0,
- "r_x1": 410.3333333333333,
- "r_y1": 191.0,
- "r_x2": 410.3333333333333,
- "r_y2": 182.33333333333334,
- "r_x3": 381.3333333333333,
- "r_y3": 182.33333333333334,
+ "r_x0": 232.66666666666666,
+ "r_y0": 126.33333333333334,
+ "r_x1": 364.0,
+ "r_y1": 126.33333333333334,
+ "r_x2": 364.0,
+ "r_y2": 105.66666666666666,
+ "r_x3": 232.66666666666666,
+ "r_y3": 105.66666666666666,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 0.95280136,
+ "confidence": 92.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 6,
+ "label": "text",
+ "bbox": {
+ "l": 265.66666666666663,
+ "t": 137.0,
+ "r": 336.0,
+ "b": 153.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
{
"index": 5,
"rgba": {
@@ -2153,22 +3428,37 @@
"a": 255
},
"rect": {
- "r_x0": 414.3333333333333,
- "r_y0": 191.0,
- "r_x1": 440.3333333333333,
- "r_y1": 191.0,
- "r_x2": 440.3333333333333,
- "r_y2": 182.33333333333334,
- "r_x3": 414.3333333333333,
- "r_y3": 182.33333333333334,
+ "r_x0": 265.66666666666663,
+ "r_y0": 153.0,
+ "r_x1": 336.0,
+ "r_y1": 153.0,
+ "r_x2": 336.0,
+ "r_y2": 137.0,
+ "r_x3": 265.66666666666663,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9649115,
+ "confidence": 94.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 7,
+ "label": "text",
+ "bbox": {
+ "l": 247.0,
+ "t": 188.33333333333331,
+ "r": 349.6666666666667,
+ "b": 204.33333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
{
"index": 6,
"rgba": {
@@ -2178,36 +3468,36 @@
"a": 255
},
"rect": {
- "r_x0": 443.3333333333333,
- "r_y0": 191.0,
- "r_x1": 479.3333333333333,
- "r_y1": 191.0,
- "r_x2": 479.3333333333333,
- "r_y2": 182.33333333333334,
- "r_x3": 443.3333333333333,
- "r_y3": 182.33333333333334,
+ "r_x0": 247.0,
+ "r_y0": 204.33333333333334,
+ "r_x1": 349.6666666666667,
+ "r_y1": 204.33333333333334,
+ "r_x2": 349.6666666666667,
+ "r_y2": 188.33333333333331,
+ "r_x3": 247.0,
+ "r_y3": 188.33333333333331,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.9639427899999999,
+ "confidence": 94.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 1,
+ "id": 8,
"label": "text",
"bbox": {
- "l": 175.0,
- "t": 228.66666666666669,
- "r": 225.66666666666669,
- "b": 237.33333333333331,
+ "l": 277.0,
+ "t": 220.0,
+ "r": 324.3333333333333,
+ "b": 236.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9129480123519897,
+ "confidence": 96.0,
"cells": [
{
"index": 7,
@@ -2218,22 +3508,37 @@
"a": 255
},
"rect": {
- "r_x0": 175.0,
- "r_y0": 237.33333333333331,
- "r_x1": 204.0,
- "r_y1": 237.33333333333331,
- "r_x2": 204.0,
- "r_y2": 228.66666666666669,
- "r_x3": 175.0,
- "r_y3": 228.66666666666669,
+ "r_x0": 277.0,
+ "r_y0": 236.0,
+ "r_x1": 324.3333333333333,
+ "r_y1": 236.0,
+ "r_x2": 324.3333333333333,
+ "r_y2": 220.0,
+ "r_x3": 277.0,
+ "r_y3": 220.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96050453,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 9,
+ "label": "text",
+ "bbox": {
+ "l": 247.0,
+ "t": 268.0,
+ "r": 349.6666666666667,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 92.0,
+ "cells": [
{
"index": 8,
"rgba": {
@@ -2243,36 +3548,36 @@
"a": 255
},
"rect": {
- "r_x0": 208.0,
- "r_y0": 237.33333333333331,
- "r_x1": 225.66666666666669,
- "r_y1": 237.33333333333331,
- "r_x2": 225.66666666666669,
- "r_y2": 231.0,
- "r_x3": 208.0,
- "r_y3": 231.0,
+ "r_x0": 247.0,
+ "r_y0": 284.0,
+ "r_x1": 349.6666666666667,
+ "r_y1": 284.0,
+ "r_x2": 349.6666666666667,
+ "r_y2": 268.0,
+ "r_x3": 247.0,
+ "r_y3": 268.0,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.9623416899999999,
+ "confidence": 92.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 2,
+ "id": 10,
"label": "text",
"bbox": {
- "l": 286.0,
- "t": 228.66666666666669,
- "r": 333.0,
- "b": 237.33333333333331,
+ "l": 277.0,
+ "t": 299.66666666666663,
+ "r": 324.3333333333333,
+ "b": 315.33333333333337,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9123309850692749,
+ "confidence": 96.0,
"cells": [
{
"index": 9,
@@ -2283,22 +3588,37 @@
"a": 255
},
"rect": {
- "r_x0": 286.0,
- "r_y0": 237.33333333333331,
- "r_x1": 313.0,
- "r_y1": 237.33333333333331,
- "r_x2": 313.0,
- "r_y2": 231.0,
- "r_x3": 286.0,
- "r_y3": 231.0,
+ "r_x0": 277.0,
+ "r_y0": 315.33333333333337,
+ "r_x1": 324.3333333333333,
+ "r_y1": 315.33333333333337,
+ "r_x2": 324.3333333333333,
+ "r_y2": 299.66666666666663,
+ "r_x3": 277.0,
+ "r_y3": 299.66666666666663,
"coord_origin": "TOPLEFT"
},
- "text": "some",
- "orig": "some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96279846,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 11,
+ "label": "text",
+ "bbox": {
+ "l": 406.3333333333333,
+ "t": 105.66666666666666,
+ "r": 518.3333333333333,
+ "b": 121.66666666666666,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
{
"index": 10,
"rgba": {
@@ -2308,36 +3628,36 @@
"a": 255
},
"rect": {
- "r_x0": 317.0,
- "r_y0": 237.33333333333331,
- "r_x1": 333.0,
- "r_y1": 237.33333333333331,
- "r_x2": 333.0,
- "r_y2": 228.66666666666669,
- "r_x3": 317.0,
- "r_y3": 228.66666666666669,
+ "r_x0": 406.3333333333333,
+ "r_y0": 121.66666666666666,
+ "r_x1": 518.3333333333333,
+ "r_y1": 121.66666666666666,
+ "r_x2": 518.3333333333333,
+ "r_y2": 105.66666666666666,
+ "r_x3": 406.3333333333333,
+ "r_y3": 105.66666666666666,
"coord_origin": "TOPLEFT"
},
- "text": "cell",
- "orig": "cell",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.96231712,
+ "confidence": 96.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 6,
+ "id": 12,
"label": "text",
"bbox": {
- "l": 398.3333333333333,
- "t": 228.66666666666669,
- "r": 463.0,
- "b": 237.33333333333331,
+ "l": 429.3333333333333,
+ "t": 137.0,
+ "r": 499.3333333333333,
+ "b": 153.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.8969476819038391,
+ "confidence": 94.0,
"cells": [
{
"index": 11,
@@ -2348,22 +3668,37 @@
"a": 255
},
"rect": {
- "r_x0": 398.3333333333333,
- "r_y0": 237.33333333333331,
- "r_x1": 422.0,
- "r_y1": 237.33333333333331,
- "r_x2": 422.0,
- "r_y2": 228.66666666666669,
- "r_x3": 398.3333333333333,
- "r_y3": 228.66666666666669,
+ "r_x0": 429.3333333333333,
+ "r_y0": 153.0,
+ "r_x1": 499.3333333333333,
+ "r_y1": 153.0,
+ "r_x2": 499.3333333333333,
+ "r_y2": 137.0,
+ "r_x3": 429.3333333333333,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.96670181,
+ "confidence": 94.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 13,
+ "label": "text",
+ "bbox": {
+ "l": 408.3333333333333,
+ "t": 188.33333333333331,
+ "r": 514.0,
+ "b": 204.33333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 12,
"rgba": {
@@ -2373,36 +3708,36 @@
"a": 255
},
"rect": {
- "r_x0": 426.0,
- "r_y0": 237.33333333333331,
- "r_x1": 463.0,
- "r_y1": 237.33333333333331,
- "r_x2": 463.0,
- "r_y2": 229.0,
- "r_x3": 426.0,
- "r_y3": 229.0,
+ "r_x0": 408.3333333333333,
+ "r_y0": 204.33333333333334,
+ "r_x1": 514.0,
+ "r_y1": 204.33333333333334,
+ "r_x2": 514.0,
+ "r_y2": 188.33333333333331,
+ "r_x3": 408.3333333333333,
+ "r_y3": 188.33333333333331,
"coord_origin": "TOPLEFT"
},
- "text": "content",
- "orig": "content",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.9589679700000001,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 0,
+ "id": 14,
"label": "text",
"bbox": {
- "l": 160.33333333333334,
- "t": 275.0,
- "r": 240.33333333333331,
- "b": 283.66666666666663,
+ "l": 440.6666666666667,
+ "t": 220.0,
+ "r": 487.6666666666667,
+ "b": 236.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9129647612571716,
+ "confidence": 95.0,
"cells": [
{
"index": 13,
@@ -2413,22 +3748,37 @@
"a": 255
},
"rect": {
- "r_x0": 160.33333333333334,
- "r_y0": 283.66666666666663,
- "r_x1": 189.33333333333331,
- "r_y1": 283.66666666666663,
- "r_x2": 189.33333333333331,
- "r_y2": 275.0,
- "r_x3": 160.33333333333334,
- "r_y3": 275.0,
+ "r_x0": 440.6666666666667,
+ "r_y0": 236.0,
+ "r_x1": 487.6666666666667,
+ "r_y1": 236.0,
+ "r_x2": 487.6666666666667,
+ "r_y2": 220.0,
+ "r_x3": 440.6666666666667,
+ "r_y3": 220.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.95674171,
+ "confidence": 95.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 15,
+ "label": "text",
+ "bbox": {
+ "l": 408.3333333333333,
+ "t": 268.0,
+ "r": 514.0,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 14,
"rgba": {
@@ -2438,22 +3788,37 @@
"a": 255
},
"rect": {
- "r_x0": 193.0,
- "r_y0": 283.66666666666663,
- "r_x1": 219.0,
- "r_y1": 283.66666666666663,
- "r_x2": 219.0,
- "r_y2": 275.0,
- "r_x3": 193.0,
- "r_y3": 275.0,
+ "r_x0": 408.3333333333333,
+ "r_y0": 284.0,
+ "r_x1": 514.0,
+ "r_y1": 284.0,
+ "r_x2": 514.0,
+ "r_y2": 268.0,
+ "r_x3": 408.3333333333333,
+ "r_y3": 268.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.9601168099999999,
+ "confidence": 95.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 16,
+ "label": "text",
+ "bbox": {
+ "l": 440.6666666666667,
+ "t": 299.66666666666663,
+ "r": 487.6666666666667,
+ "b": 315.33333333333337,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 15,
"rgba": {
@@ -2463,85 +3828,20 @@
"a": 255
},
"rect": {
- "r_x0": 222.66666666666669,
- "r_y0": 283.66666666666663,
- "r_x1": 240.33333333333331,
- "r_y1": 283.66666666666663,
- "r_x2": 240.33333333333331,
- "r_y2": 277.33333333333337,
- "r_x3": 222.66666666666669,
- "r_y3": 277.33333333333337,
+ "r_x0": 440.6666666666667,
+ "r_y0": 315.33333333333337,
+ "r_x1": 487.6666666666667,
+ "r_y1": 315.33333333333337,
+ "r_x2": 487.6666666666667,
+ "r_y2": 299.66666666666663,
+ "r_x3": 440.6666666666667,
+ "r_y3": 299.66666666666663,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96364174,
- "from_ocr": true
- }
- ],
- "children": []
- },
- {
- "id": 3,
- "label": "text",
- "bbox": {
- "l": 283.0,
- "t": 275.0,
- "r": 336.33333333333337,
- "b": 283.66666666666663,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.9102913737297058,
- "cells": [
- {
- "index": 16,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 283.0,
- "r_y0": 283.66666666666663,
- "r_x1": 309.0,
- "r_y1": 283.66666666666663,
- "r_x2": 309.0,
- "r_y2": 275.0,
- "r_x3": 283.0,
- "r_y3": 275.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.9636872099999999,
- "from_ocr": true
- },
- {
- "index": 17,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 312.33333333333337,
- "r_y0": 283.66666666666663,
- "r_x1": 336.33333333333337,
- "r_y1": 283.66666666666663,
- "r_x2": 336.33333333333337,
- "r_y2": 275.0,
- "r_x3": 312.33333333333337,
- "r_y3": 275.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "don't",
- "orig": "don't",
- "text_direction": "left_to_right",
- "confidence": 0.9636872099999999,
+ "confidence": 95.0,
"from_ocr": true
}
],
@@ -2549,25 +3849,214 @@
}
]
},
- "text": null
+ "text": null,
+ "otsl_seq": [
+ "ched",
+ "ched",
+ "ched",
+ "nl",
+ "fcel",
+ "fcel",
+ "fcel",
+ "nl",
+ "fcel",
+ "fcel",
+ "fcel",
+ "nl"
+ ],
+ "num_rows": 3,
+ "num_cols": 3,
+ "table_cells": [
+ {
+ "bbox": {
+ "l": 97.33333333333333,
+ "t": 105.66666666666666,
+ "r": 190.0,
+ "b": 126.33333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 0,
+ "end_col_offset_idx": 1,
+ "text": "Vertically merged",
+ "column_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 121.66666666666667,
+ "t": 204.33333333333334,
+ "r": 168.66666666666666,
+ "b": 220.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 0,
+ "end_col_offset_idx": 1,
+ "text": "value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 121.66666666666667,
+ "t": 284.0,
+ "r": 168.66666666666666,
+ "b": 300.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 2,
+ "end_row_offset_idx": 3,
+ "start_col_offset_idx": 0,
+ "end_col_offset_idx": 1,
+ "text": "value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 232.66666666666666,
+ "t": 105.66666666666666,
+ "r": 364.0,
+ "b": 126.33333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Other merged column",
+ "column_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 247.0,
+ "t": 188.33333333333331,
+ "r": 349.6666666666667,
+ "b": 204.33333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Some other value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 247.0,
+ "t": 268.0,
+ "r": 349.6666666666667,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 2,
+ "end_row_offset_idx": 3,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Some other value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 406.3333333333333,
+ "t": 105.66666666666666,
+ "r": 518.3333333333333,
+ "b": 121.66666666666666,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another column",
+ "column_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 408.3333333333333,
+ "t": 188.33333333333331,
+ "r": 514.0,
+ "b": 204.33333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 408.3333333333333,
+ "t": 268.0,
+ "r": 514.0,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 2,
+ "end_row_offset_idx": 3,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ }
+ ]
}
],
"body": [
{
- "label": "section_header",
- "id": 9,
+ "label": "table",
+ "id": 0,
"page_no": 0,
"cluster": {
- "id": 9,
- "label": "section_header",
+ "id": 0,
+ "label": "table",
"bbox": {
- "l": 201.26343,
- "t": 72.85059000000001,
- "r": 417.96021,
- "b": 101.89746000000002,
+ "l": 69.04969024658203,
+ "t": 87.64955139160156,
+ "r": 551.0990600585938,
+ "b": 334.58026123046875,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.6777006387710571,
+ "confidence": 0.9790865778923035,
"cells": [
{
"index": 0,
@@ -2578,43 +4067,22 @@
"a": 255
},
"rect": {
- "r_x0": 201.26343,
- "r_y0": 101.89746000000002,
- "r_x1": 417.96021,
- "r_y1": 101.89746000000002,
- "r_x2": 417.96021,
- "r_y2": 72.85059000000001,
- "r_x3": 201.26343,
- "r_y3": 72.85059000000001,
+ "r_x0": 97.33333333333333,
+ "r_y0": 126.33333333333334,
+ "r_x1": 190.0,
+ "r_y1": 126.33333333333334,
+ "r_x2": 190.0,
+ "r_y2": 105.66666666666666,
+ "r_x3": 97.33333333333333,
+ "r_y3": 105.66666666666666,
"coord_origin": "TOPLEFT"
},
- "text": "This is a table test ",
- "orig": "This is a table test ",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- }
- ],
- "children": []
- },
- "text": "This is a table test"
- },
- {
- "label": "text",
- "id": 7,
- "page_no": 0,
- "cluster": {
- "id": 7,
- "label": "text",
- "bbox": {
- "l": 72.0,
- "t": 124.28821000000016,
- "r": 376.27319,
- "b": 136.57727,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.8428522944450378,
- "cells": [
+ "confidence": 89.0,
+ "from_ocr": true
+ },
{
"index": 1,
"rgba": {
@@ -2624,43 +4092,22 @@
"a": 255
},
"rect": {
- "r_x0": 72.0,
- "r_y0": 136.57727,
- "r_x1": 376.27319,
- "r_y1": 136.57727,
- "r_x2": 376.27319,
- "r_y2": 124.28821000000016,
- "r_x3": 72.0,
- "r_y3": 124.28821000000016,
+ "r_x0": 112.0,
+ "r_y0": 157.66666666666669,
+ "r_x1": 182.33333333333334,
+ "r_y1": 157.66666666666669,
+ "r_x2": 182.33333333333334,
+ "r_y2": 137.0,
+ "r_x3": 112.0,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "The test starts with some random text and then a table image: ",
- "orig": "The test starts with some random text and then a table image: ",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- }
- ],
- "children": []
- },
- "text": "The test starts with some random text and then a table image:"
- },
- {
- "label": "form",
- "id": 8,
- "page_no": 0,
- "cluster": {
- "id": 8,
- "label": "form",
- "bbox": {
- "l": 160.33333333333334,
- "t": 182.33333333333334,
- "r": 479.3333333333333,
- "b": 283.66666666666663,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.7274590134620667,
- "cells": [
+ "confidence": 92.0,
+ "from_ocr": true
+ },
{
"index": 2,
"rgba": {
@@ -2670,20 +4117,20 @@
"a": 255
},
"rect": {
- "r_x0": 275.33333333333337,
- "r_y0": 191.0,
- "r_x1": 304.0,
- "r_y1": 191.0,
- "r_x2": 304.0,
- "r_y2": 182.33333333333334,
- "r_x3": 275.33333333333337,
- "r_y3": 182.33333333333334,
+ "r_x0": 121.66666666666667,
+ "r_y0": 220.0,
+ "r_x1": 168.66666666666666,
+ "r_y1": 220.0,
+ "r_x2": 168.66666666666666,
+ "r_y2": 204.33333333333334,
+ "r_x3": 121.66666666666667,
+ "r_y3": 204.33333333333334,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9609484899999999,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -2695,20 +4142,20 @@
"a": 255
},
"rect": {
- "r_x0": 308.0,
- "r_y0": 191.0,
- "r_x1": 343.66666666666663,
- "r_y1": 191.0,
- "r_x2": 343.66666666666663,
- "r_y2": 182.33333333333334,
- "r_x3": 308.0,
- "r_y3": 182.33333333333334,
+ "r_x0": 121.66666666666667,
+ "r_y0": 300.0,
+ "r_x1": 168.66666666666666,
+ "r_y1": 300.0,
+ "r_x2": 168.66666666666666,
+ "r_y2": 284.0,
+ "r_x3": 121.66666666666667,
+ "r_y3": 284.0,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.95935837,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -2720,20 +4167,20 @@
"a": 255
},
"rect": {
- "r_x0": 381.3333333333333,
- "r_y0": 191.0,
- "r_x1": 410.3333333333333,
- "r_y1": 191.0,
- "r_x2": 410.3333333333333,
- "r_y2": 182.33333333333334,
- "r_x3": 381.3333333333333,
- "r_y3": 182.33333333333334,
+ "r_x0": 232.66666666666666,
+ "r_y0": 126.33333333333334,
+ "r_x1": 364.0,
+ "r_y1": 126.33333333333334,
+ "r_x2": 364.0,
+ "r_y2": 105.66666666666666,
+ "r_x3": 232.66666666666666,
+ "r_y3": 105.66666666666666,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 0.95280136,
+ "confidence": 92.0,
"from_ocr": true
},
{
@@ -2745,20 +4192,20 @@
"a": 255
},
"rect": {
- "r_x0": 414.3333333333333,
- "r_y0": 191.0,
- "r_x1": 440.3333333333333,
- "r_y1": 191.0,
- "r_x2": 440.3333333333333,
- "r_y2": 182.33333333333334,
- "r_x3": 414.3333333333333,
- "r_y3": 182.33333333333334,
+ "r_x0": 265.66666666666663,
+ "r_y0": 153.0,
+ "r_x1": 336.0,
+ "r_y1": 153.0,
+ "r_x2": 336.0,
+ "r_y2": 137.0,
+ "r_x3": 265.66666666666663,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9649115,
+ "confidence": 94.0,
"from_ocr": true
},
{
@@ -2770,20 +4217,20 @@
"a": 255
},
"rect": {
- "r_x0": 443.3333333333333,
- "r_y0": 191.0,
- "r_x1": 479.3333333333333,
- "r_y1": 191.0,
- "r_x2": 479.3333333333333,
- "r_y2": 182.33333333333334,
- "r_x3": 443.3333333333333,
- "r_y3": 182.33333333333334,
+ "r_x0": 247.0,
+ "r_y0": 204.33333333333334,
+ "r_x1": 349.6666666666667,
+ "r_y1": 204.33333333333334,
+ "r_x2": 349.6666666666667,
+ "r_y2": 188.33333333333331,
+ "r_x3": 247.0,
+ "r_y3": 188.33333333333331,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.9639427899999999,
+ "confidence": 94.0,
"from_ocr": true
},
{
@@ -2795,20 +4242,20 @@
"a": 255
},
"rect": {
- "r_x0": 175.0,
- "r_y0": 237.33333333333331,
- "r_x1": 204.0,
- "r_y1": 237.33333333333331,
- "r_x2": 204.0,
- "r_y2": 228.66666666666669,
- "r_x3": 175.0,
- "r_y3": 228.66666666666669,
+ "r_x0": 277.0,
+ "r_y0": 236.0,
+ "r_x1": 324.3333333333333,
+ "r_y1": 236.0,
+ "r_x2": 324.3333333333333,
+ "r_y2": 220.0,
+ "r_x3": 277.0,
+ "r_y3": 220.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96050453,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -2820,20 +4267,20 @@
"a": 255
},
"rect": {
- "r_x0": 208.0,
- "r_y0": 237.33333333333331,
- "r_x1": 225.66666666666669,
- "r_y1": 237.33333333333331,
- "r_x2": 225.66666666666669,
- "r_y2": 231.0,
- "r_x3": 208.0,
- "r_y3": 231.0,
+ "r_x0": 247.0,
+ "r_y0": 284.0,
+ "r_x1": 349.6666666666667,
+ "r_y1": 284.0,
+ "r_x2": 349.6666666666667,
+ "r_y2": 268.0,
+ "r_x3": 247.0,
+ "r_y3": 268.0,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.9623416899999999,
+ "confidence": 92.0,
"from_ocr": true
},
{
@@ -2845,20 +4292,20 @@
"a": 255
},
"rect": {
- "r_x0": 286.0,
- "r_y0": 237.33333333333331,
- "r_x1": 313.0,
- "r_y1": 237.33333333333331,
- "r_x2": 313.0,
- "r_y2": 231.0,
- "r_x3": 286.0,
- "r_y3": 231.0,
+ "r_x0": 277.0,
+ "r_y0": 315.33333333333337,
+ "r_x1": 324.3333333333333,
+ "r_y1": 315.33333333333337,
+ "r_x2": 324.3333333333333,
+ "r_y2": 299.66666666666663,
+ "r_x3": 277.0,
+ "r_y3": 299.66666666666663,
"coord_origin": "TOPLEFT"
},
- "text": "some",
- "orig": "some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96279846,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -2870,20 +4317,20 @@
"a": 255
},
"rect": {
- "r_x0": 317.0,
- "r_y0": 237.33333333333331,
- "r_x1": 333.0,
- "r_y1": 237.33333333333331,
- "r_x2": 333.0,
- "r_y2": 228.66666666666669,
- "r_x3": 317.0,
- "r_y3": 228.66666666666669,
+ "r_x0": 406.3333333333333,
+ "r_y0": 121.66666666666666,
+ "r_x1": 518.3333333333333,
+ "r_y1": 121.66666666666666,
+ "r_x2": 518.3333333333333,
+ "r_y2": 105.66666666666666,
+ "r_x3": 406.3333333333333,
+ "r_y3": 105.66666666666666,
"coord_origin": "TOPLEFT"
},
- "text": "cell",
- "orig": "cell",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.96231712,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -2895,20 +4342,20 @@
"a": 255
},
"rect": {
- "r_x0": 398.3333333333333,
- "r_y0": 237.33333333333331,
- "r_x1": 422.0,
- "r_y1": 237.33333333333331,
- "r_x2": 422.0,
- "r_y2": 228.66666666666669,
- "r_x3": 398.3333333333333,
- "r_y3": 228.66666666666669,
+ "r_x0": 429.3333333333333,
+ "r_y0": 153.0,
+ "r_x1": 499.3333333333333,
+ "r_y1": 153.0,
+ "r_x2": 499.3333333333333,
+ "r_y2": 137.0,
+ "r_x3": 429.3333333333333,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.96670181,
+ "confidence": 94.0,
"from_ocr": true
},
{
@@ -2920,20 +4367,20 @@
"a": 255
},
"rect": {
- "r_x0": 426.0,
- "r_y0": 237.33333333333331,
- "r_x1": 463.0,
- "r_y1": 237.33333333333331,
- "r_x2": 463.0,
- "r_y2": 229.0,
- "r_x3": 426.0,
- "r_y3": 229.0,
+ "r_x0": 408.3333333333333,
+ "r_y0": 204.33333333333334,
+ "r_x1": 514.0,
+ "r_y1": 204.33333333333334,
+ "r_x2": 514.0,
+ "r_y2": 188.33333333333331,
+ "r_x3": 408.3333333333333,
+ "r_y3": 188.33333333333331,
"coord_origin": "TOPLEFT"
},
- "text": "content",
- "orig": "content",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.9589679700000001,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -2945,20 +4392,20 @@
"a": 255
},
"rect": {
- "r_x0": 160.33333333333334,
- "r_y0": 283.66666666666663,
- "r_x1": 189.33333333333331,
- "r_y1": 283.66666666666663,
- "r_x2": 189.33333333333331,
- "r_y2": 275.0,
- "r_x3": 160.33333333333334,
- "r_y3": 275.0,
+ "r_x0": 440.6666666666667,
+ "r_y0": 236.0,
+ "r_x1": 487.6666666666667,
+ "r_y1": 236.0,
+ "r_x2": 487.6666666666667,
+ "r_y2": 220.0,
+ "r_x3": 440.6666666666667,
+ "r_y3": 220.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.95674171,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -2970,20 +4417,20 @@
"a": 255
},
"rect": {
- "r_x0": 193.0,
- "r_y0": 283.66666666666663,
- "r_x1": 219.0,
- "r_y1": 283.66666666666663,
- "r_x2": 219.0,
- "r_y2": 275.0,
- "r_x3": 193.0,
- "r_y3": 275.0,
+ "r_x0": 408.3333333333333,
+ "r_y0": 284.0,
+ "r_x1": 514.0,
+ "r_y1": 284.0,
+ "r_x2": 514.0,
+ "r_y2": 268.0,
+ "r_x3": 408.3333333333333,
+ "r_y3": 268.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.9601168099999999,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -2995,85 +4442,115 @@
"a": 255
},
"rect": {
- "r_x0": 222.66666666666669,
- "r_y0": 283.66666666666663,
- "r_x1": 240.33333333333331,
- "r_y1": 283.66666666666663,
- "r_x2": 240.33333333333331,
- "r_y2": 277.33333333333337,
- "r_x3": 222.66666666666669,
- "r_y3": 277.33333333333337,
+ "r_x0": 440.6666666666667,
+ "r_y0": 315.33333333333337,
+ "r_x1": 487.6666666666667,
+ "r_y1": 315.33333333333337,
+ "r_x2": 487.6666666666667,
+ "r_y2": 299.66666666666663,
+ "r_x3": 440.6666666666667,
+ "r_y3": 299.66666666666663,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96364174,
- "from_ocr": true
- },
- {
- "index": 16,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 283.0,
- "r_y0": 283.66666666666663,
- "r_x1": 309.0,
- "r_y1": 283.66666666666663,
- "r_x2": 309.0,
- "r_y2": 275.0,
- "r_x3": 283.0,
- "r_y3": 275.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.9636872099999999,
- "from_ocr": true
- },
- {
- "index": 17,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 312.33333333333337,
- "r_y0": 283.66666666666663,
- "r_x1": 336.33333333333337,
- "r_y1": 283.66666666666663,
- "r_x2": 336.33333333333337,
- "r_y2": 275.0,
- "r_x3": 312.33333333333337,
- "r_y3": 275.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "don't",
- "orig": "don't",
- "text_direction": "left_to_right",
- "confidence": 0.9636872099999999,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": [
{
- "id": 4,
+ "id": 1,
"label": "text",
"bbox": {
- "l": 275.33333333333337,
- "t": 182.33333333333334,
- "r": 343.66666666666663,
- "b": 191.0,
+ "l": 97.33333333333333,
+ "t": 105.66666666666666,
+ "r": 190.0,
+ "b": 126.33333333333334,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9056976437568665,
+ "confidence": 89.0,
+ "cells": [
+ {
+ "index": 0,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 97.33333333333333,
+ "r_y0": 126.33333333333334,
+ "r_x1": 190.0,
+ "r_y1": 126.33333333333334,
+ "r_x2": 190.0,
+ "r_y2": 105.66666666666666,
+ "r_x3": 97.33333333333333,
+ "r_y3": 105.66666666666666,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Vertically",
+ "orig": "Vertically",
+ "text_direction": "left_to_right",
+ "confidence": 89.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 2,
+ "label": "text",
+ "bbox": {
+ "l": 112.0,
+ "t": 137.0,
+ "r": 182.33333333333334,
+ "b": 157.66666666666669,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 92.0,
+ "cells": [
+ {
+ "index": 1,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 112.0,
+ "r_y0": 157.66666666666669,
+ "r_x1": 182.33333333333334,
+ "r_y1": 157.66666666666669,
+ "r_x2": 182.33333333333334,
+ "r_y2": 137.0,
+ "r_x3": 112.0,
+ "r_y3": 137.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "merged",
+ "orig": "merged",
+ "text_direction": "left_to_right",
+ "confidence": 92.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 3,
+ "label": "text",
+ "bbox": {
+ "l": 121.66666666666667,
+ "t": 204.33333333333334,
+ "r": 168.66666666666666,
+ "b": 220.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
"cells": [
{
"index": 2,
@@ -3084,22 +4561,37 @@
"a": 255
},
"rect": {
- "r_x0": 275.33333333333337,
- "r_y0": 191.0,
- "r_x1": 304.0,
- "r_y1": 191.0,
- "r_x2": 304.0,
- "r_y2": 182.33333333333334,
- "r_x3": 275.33333333333337,
- "r_y3": 182.33333333333334,
+ "r_x0": 121.66666666666667,
+ "r_y0": 220.0,
+ "r_x1": 168.66666666666666,
+ "r_y1": 220.0,
+ "r_x2": 168.66666666666666,
+ "r_y2": 204.33333333333334,
+ "r_x3": 121.66666666666667,
+ "r_y3": 204.33333333333334,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9609484899999999,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 4,
+ "label": "text",
+ "bbox": {
+ "l": 121.66666666666667,
+ "t": 284.0,
+ "r": 168.66666666666666,
+ "b": 300.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
{
"index": 3,
"rgba": {
@@ -3109,20 +4601,20 @@
"a": 255
},
"rect": {
- "r_x0": 308.0,
- "r_y0": 191.0,
- "r_x1": 343.66666666666663,
- "r_y1": 191.0,
- "r_x2": 343.66666666666663,
- "r_y2": 182.33333333333334,
- "r_x3": 308.0,
- "r_y3": 182.33333333333334,
+ "r_x0": 121.66666666666667,
+ "r_y0": 300.0,
+ "r_x1": 168.66666666666666,
+ "r_y1": 300.0,
+ "r_x2": 168.66666666666666,
+ "r_y2": 284.0,
+ "r_x3": 121.66666666666667,
+ "r_y3": 284.0,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.95935837,
+ "confidence": 96.0,
"from_ocr": true
}
],
@@ -3132,13 +4624,13 @@
"id": 5,
"label": "text",
"bbox": {
- "l": 381.3333333333333,
- "t": 182.33333333333334,
- "r": 479.3333333333333,
- "b": 191.0,
+ "l": 232.66666666666666,
+ "t": 105.66666666666666,
+ "r": 364.0,
+ "b": 126.33333333333334,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9007152318954468,
+ "confidence": 92.0,
"cells": [
{
"index": 4,
@@ -3149,22 +4641,37 @@
"a": 255
},
"rect": {
- "r_x0": 381.3333333333333,
- "r_y0": 191.0,
- "r_x1": 410.3333333333333,
- "r_y1": 191.0,
- "r_x2": 410.3333333333333,
- "r_y2": 182.33333333333334,
- "r_x3": 381.3333333333333,
- "r_y3": 182.33333333333334,
+ "r_x0": 232.66666666666666,
+ "r_y0": 126.33333333333334,
+ "r_x1": 364.0,
+ "r_y1": 126.33333333333334,
+ "r_x2": 364.0,
+ "r_y2": 105.66666666666666,
+ "r_x3": 232.66666666666666,
+ "r_y3": 105.66666666666666,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 0.95280136,
+ "confidence": 92.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 6,
+ "label": "text",
+ "bbox": {
+ "l": 265.66666666666663,
+ "t": 137.0,
+ "r": 336.0,
+ "b": 153.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
{
"index": 5,
"rgba": {
@@ -3174,22 +4681,37 @@
"a": 255
},
"rect": {
- "r_x0": 414.3333333333333,
- "r_y0": 191.0,
- "r_x1": 440.3333333333333,
- "r_y1": 191.0,
- "r_x2": 440.3333333333333,
- "r_y2": 182.33333333333334,
- "r_x3": 414.3333333333333,
- "r_y3": 182.33333333333334,
+ "r_x0": 265.66666666666663,
+ "r_y0": 153.0,
+ "r_x1": 336.0,
+ "r_y1": 153.0,
+ "r_x2": 336.0,
+ "r_y2": 137.0,
+ "r_x3": 265.66666666666663,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9649115,
+ "confidence": 94.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 7,
+ "label": "text",
+ "bbox": {
+ "l": 247.0,
+ "t": 188.33333333333331,
+ "r": 349.6666666666667,
+ "b": 204.33333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
{
"index": 6,
"rgba": {
@@ -3199,36 +4721,36 @@
"a": 255
},
"rect": {
- "r_x0": 443.3333333333333,
- "r_y0": 191.0,
- "r_x1": 479.3333333333333,
- "r_y1": 191.0,
- "r_x2": 479.3333333333333,
- "r_y2": 182.33333333333334,
- "r_x3": 443.3333333333333,
- "r_y3": 182.33333333333334,
+ "r_x0": 247.0,
+ "r_y0": 204.33333333333334,
+ "r_x1": 349.6666666666667,
+ "r_y1": 204.33333333333334,
+ "r_x2": 349.6666666666667,
+ "r_y2": 188.33333333333331,
+ "r_x3": 247.0,
+ "r_y3": 188.33333333333331,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.9639427899999999,
+ "confidence": 94.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 1,
+ "id": 8,
"label": "text",
"bbox": {
- "l": 175.0,
- "t": 228.66666666666669,
- "r": 225.66666666666669,
- "b": 237.33333333333331,
+ "l": 277.0,
+ "t": 220.0,
+ "r": 324.3333333333333,
+ "b": 236.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9129480123519897,
+ "confidence": 96.0,
"cells": [
{
"index": 7,
@@ -3239,22 +4761,37 @@
"a": 255
},
"rect": {
- "r_x0": 175.0,
- "r_y0": 237.33333333333331,
- "r_x1": 204.0,
- "r_y1": 237.33333333333331,
- "r_x2": 204.0,
- "r_y2": 228.66666666666669,
- "r_x3": 175.0,
- "r_y3": 228.66666666666669,
+ "r_x0": 277.0,
+ "r_y0": 236.0,
+ "r_x1": 324.3333333333333,
+ "r_y1": 236.0,
+ "r_x2": 324.3333333333333,
+ "r_y2": 220.0,
+ "r_x3": 277.0,
+ "r_y3": 220.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96050453,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 9,
+ "label": "text",
+ "bbox": {
+ "l": 247.0,
+ "t": 268.0,
+ "r": 349.6666666666667,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 92.0,
+ "cells": [
{
"index": 8,
"rgba": {
@@ -3264,36 +4801,36 @@
"a": 255
},
"rect": {
- "r_x0": 208.0,
- "r_y0": 237.33333333333331,
- "r_x1": 225.66666666666669,
- "r_y1": 237.33333333333331,
- "r_x2": 225.66666666666669,
- "r_y2": 231.0,
- "r_x3": 208.0,
- "r_y3": 231.0,
+ "r_x0": 247.0,
+ "r_y0": 284.0,
+ "r_x1": 349.6666666666667,
+ "r_y1": 284.0,
+ "r_x2": 349.6666666666667,
+ "r_y2": 268.0,
+ "r_x3": 247.0,
+ "r_y3": 268.0,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.9623416899999999,
+ "confidence": 92.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 2,
+ "id": 10,
"label": "text",
"bbox": {
- "l": 286.0,
- "t": 228.66666666666669,
- "r": 333.0,
- "b": 237.33333333333331,
+ "l": 277.0,
+ "t": 299.66666666666663,
+ "r": 324.3333333333333,
+ "b": 315.33333333333337,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9123309850692749,
+ "confidence": 96.0,
"cells": [
{
"index": 9,
@@ -3304,22 +4841,37 @@
"a": 255
},
"rect": {
- "r_x0": 286.0,
- "r_y0": 237.33333333333331,
- "r_x1": 313.0,
- "r_y1": 237.33333333333331,
- "r_x2": 313.0,
- "r_y2": 231.0,
- "r_x3": 286.0,
- "r_y3": 231.0,
+ "r_x0": 277.0,
+ "r_y0": 315.33333333333337,
+ "r_x1": 324.3333333333333,
+ "r_y1": 315.33333333333337,
+ "r_x2": 324.3333333333333,
+ "r_y2": 299.66666666666663,
+ "r_x3": 277.0,
+ "r_y3": 299.66666666666663,
"coord_origin": "TOPLEFT"
},
- "text": "some",
- "orig": "some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96279846,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 11,
+ "label": "text",
+ "bbox": {
+ "l": 406.3333333333333,
+ "t": 105.66666666666666,
+ "r": 518.3333333333333,
+ "b": 121.66666666666666,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
{
"index": 10,
"rgba": {
@@ -3329,36 +4881,36 @@
"a": 255
},
"rect": {
- "r_x0": 317.0,
- "r_y0": 237.33333333333331,
- "r_x1": 333.0,
- "r_y1": 237.33333333333331,
- "r_x2": 333.0,
- "r_y2": 228.66666666666669,
- "r_x3": 317.0,
- "r_y3": 228.66666666666669,
+ "r_x0": 406.3333333333333,
+ "r_y0": 121.66666666666666,
+ "r_x1": 518.3333333333333,
+ "r_y1": 121.66666666666666,
+ "r_x2": 518.3333333333333,
+ "r_y2": 105.66666666666666,
+ "r_x3": 406.3333333333333,
+ "r_y3": 105.66666666666666,
"coord_origin": "TOPLEFT"
},
- "text": "cell",
- "orig": "cell",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.96231712,
+ "confidence": 96.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 6,
+ "id": 12,
"label": "text",
"bbox": {
- "l": 398.3333333333333,
- "t": 228.66666666666669,
- "r": 463.0,
- "b": 237.33333333333331,
+ "l": 429.3333333333333,
+ "t": 137.0,
+ "r": 499.3333333333333,
+ "b": 153.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.8969476819038391,
+ "confidence": 94.0,
"cells": [
{
"index": 11,
@@ -3369,22 +4921,37 @@
"a": 255
},
"rect": {
- "r_x0": 398.3333333333333,
- "r_y0": 237.33333333333331,
- "r_x1": 422.0,
- "r_y1": 237.33333333333331,
- "r_x2": 422.0,
- "r_y2": 228.66666666666669,
- "r_x3": 398.3333333333333,
- "r_y3": 228.66666666666669,
+ "r_x0": 429.3333333333333,
+ "r_y0": 153.0,
+ "r_x1": 499.3333333333333,
+ "r_y1": 153.0,
+ "r_x2": 499.3333333333333,
+ "r_y2": 137.0,
+ "r_x3": 429.3333333333333,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.96670181,
+ "confidence": 94.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 13,
+ "label": "text",
+ "bbox": {
+ "l": 408.3333333333333,
+ "t": 188.33333333333331,
+ "r": 514.0,
+ "b": 204.33333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 12,
"rgba": {
@@ -3394,36 +4961,36 @@
"a": 255
},
"rect": {
- "r_x0": 426.0,
- "r_y0": 237.33333333333331,
- "r_x1": 463.0,
- "r_y1": 237.33333333333331,
- "r_x2": 463.0,
- "r_y2": 229.0,
- "r_x3": 426.0,
- "r_y3": 229.0,
+ "r_x0": 408.3333333333333,
+ "r_y0": 204.33333333333334,
+ "r_x1": 514.0,
+ "r_y1": 204.33333333333334,
+ "r_x2": 514.0,
+ "r_y2": 188.33333333333331,
+ "r_x3": 408.3333333333333,
+ "r_y3": 188.33333333333331,
"coord_origin": "TOPLEFT"
},
- "text": "content",
- "orig": "content",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.9589679700000001,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 0,
+ "id": 14,
"label": "text",
"bbox": {
- "l": 160.33333333333334,
- "t": 275.0,
- "r": 240.33333333333331,
- "b": 283.66666666666663,
+ "l": 440.6666666666667,
+ "t": 220.0,
+ "r": 487.6666666666667,
+ "b": 236.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9129647612571716,
+ "confidence": 95.0,
"cells": [
{
"index": 13,
@@ -3434,22 +5001,37 @@
"a": 255
},
"rect": {
- "r_x0": 160.33333333333334,
- "r_y0": 283.66666666666663,
- "r_x1": 189.33333333333331,
- "r_y1": 283.66666666666663,
- "r_x2": 189.33333333333331,
- "r_y2": 275.0,
- "r_x3": 160.33333333333334,
- "r_y3": 275.0,
+ "r_x0": 440.6666666666667,
+ "r_y0": 236.0,
+ "r_x1": 487.6666666666667,
+ "r_y1": 236.0,
+ "r_x2": 487.6666666666667,
+ "r_y2": 220.0,
+ "r_x3": 440.6666666666667,
+ "r_y3": 220.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.95674171,
+ "confidence": 95.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 15,
+ "label": "text",
+ "bbox": {
+ "l": 408.3333333333333,
+ "t": 268.0,
+ "r": 514.0,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 14,
"rgba": {
@@ -3459,22 +5041,37 @@
"a": 255
},
"rect": {
- "r_x0": 193.0,
- "r_y0": 283.66666666666663,
- "r_x1": 219.0,
- "r_y1": 283.66666666666663,
- "r_x2": 219.0,
- "r_y2": 275.0,
- "r_x3": 193.0,
- "r_y3": 275.0,
+ "r_x0": 408.3333333333333,
+ "r_y0": 284.0,
+ "r_x1": 514.0,
+ "r_y1": 284.0,
+ "r_x2": 514.0,
+ "r_y2": 268.0,
+ "r_x3": 408.3333333333333,
+ "r_y3": 268.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.9601168099999999,
+ "confidence": 95.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 16,
+ "label": "text",
+ "bbox": {
+ "l": 440.6666666666667,
+ "t": 299.66666666666663,
+ "r": 487.6666666666667,
+ "b": 315.33333333333337,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 15,
"rgba": {
@@ -3484,85 +5081,20 @@
"a": 255
},
"rect": {
- "r_x0": 222.66666666666669,
- "r_y0": 283.66666666666663,
- "r_x1": 240.33333333333331,
- "r_y1": 283.66666666666663,
- "r_x2": 240.33333333333331,
- "r_y2": 277.33333333333337,
- "r_x3": 222.66666666666669,
- "r_y3": 277.33333333333337,
+ "r_x0": 440.6666666666667,
+ "r_y0": 315.33333333333337,
+ "r_x1": 487.6666666666667,
+ "r_y1": 315.33333333333337,
+ "r_x2": 487.6666666666667,
+ "r_y2": 299.66666666666663,
+ "r_x3": 440.6666666666667,
+ "r_y3": 299.66666666666663,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96364174,
- "from_ocr": true
- }
- ],
- "children": []
- },
- {
- "id": 3,
- "label": "text",
- "bbox": {
- "l": 283.0,
- "t": 275.0,
- "r": 336.33333333333337,
- "b": 283.66666666666663,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.9102913737297058,
- "cells": [
- {
- "index": 16,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 283.0,
- "r_y0": 283.66666666666663,
- "r_x1": 309.0,
- "r_y1": 283.66666666666663,
- "r_x2": 309.0,
- "r_y2": 275.0,
- "r_x3": 283.0,
- "r_y3": 275.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.9636872099999999,
- "from_ocr": true
- },
- {
- "index": 17,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 312.33333333333337,
- "r_y0": 283.66666666666663,
- "r_x1": 336.33333333333337,
- "r_y1": 283.66666666666663,
- "r_x2": 336.33333333333337,
- "r_y2": 275.0,
- "r_x3": 312.33333333333337,
- "r_y3": 275.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "don't",
- "orig": "don't",
- "text_direction": "left_to_right",
- "confidence": 0.9636872099999999,
+ "confidence": 95.0,
"from_ocr": true
}
],
@@ -3570,7 +5102,196 @@
}
]
},
- "text": null
+ "text": null,
+ "otsl_seq": [
+ "ched",
+ "ched",
+ "ched",
+ "nl",
+ "fcel",
+ "fcel",
+ "fcel",
+ "nl",
+ "fcel",
+ "fcel",
+ "fcel",
+ "nl"
+ ],
+ "num_rows": 3,
+ "num_cols": 3,
+ "table_cells": [
+ {
+ "bbox": {
+ "l": 97.33333333333333,
+ "t": 105.66666666666666,
+ "r": 190.0,
+ "b": 126.33333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 0,
+ "end_col_offset_idx": 1,
+ "text": "Vertically merged",
+ "column_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 121.66666666666667,
+ "t": 204.33333333333334,
+ "r": 168.66666666666666,
+ "b": 220.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 0,
+ "end_col_offset_idx": 1,
+ "text": "value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 121.66666666666667,
+ "t": 284.0,
+ "r": 168.66666666666666,
+ "b": 300.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 2,
+ "end_row_offset_idx": 3,
+ "start_col_offset_idx": 0,
+ "end_col_offset_idx": 1,
+ "text": "value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 232.66666666666666,
+ "t": 105.66666666666666,
+ "r": 364.0,
+ "b": 126.33333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Other merged column",
+ "column_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 247.0,
+ "t": 188.33333333333331,
+ "r": 349.6666666666667,
+ "b": 204.33333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Some other value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 247.0,
+ "t": 268.0,
+ "r": 349.6666666666667,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 2,
+ "end_row_offset_idx": 3,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Some other value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 406.3333333333333,
+ "t": 105.66666666666666,
+ "r": 518.3333333333333,
+ "b": 121.66666666666666,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another column",
+ "column_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 408.3333333333333,
+ "t": 188.33333333333331,
+ "r": 514.0,
+ "b": 204.33333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 408.3333333333333,
+ "t": 268.0,
+ "r": 514.0,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 2,
+ "end_row_offset_idx": 3,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ }
+ ]
}
],
"headers": []
diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_180.doctags.txt b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_180.doctags.txt
index 0424fbee..4de7af73 100644
--- a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_180.doctags.txt
+++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_180.doctags.txt
@@ -1,9 +1,8 @@
-
-insidenothingand last row 2
-haveotherand row 1
-andhave contentsome cellsthis is row 0
-Column 2Column 1Column 0
+
+Vertically mergedOther merged columnYet another column
+valueSome other valueYet another value
+valueSome other valueYet another value
\ No newline at end of file
diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_180.json b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_180.json
index 07e64090..b02a5df9 100644
--- a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_180.json
+++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_180.json
@@ -27,13 +27,13 @@
"file-info": {
"filename": "ocr_test_rotated_180.pdf",
"filename-prov": null,
- "document-hash": "687553cff95da8e2898fa50a68986ee2a3735ba5d287615e03c0d40fd3b33758",
+ "document-hash": "361fa0fc8db9c3a973d316d08509ac78cc0e7f81dea94358319092640d439ca0",
"#-pages": 1,
"collection-name": null,
"description": null,
"page-hashes": [
{
- "hash": "9e7213c0aa5ff85dfdb9a5b7566dfd229a4c5b8a4e289dd68655ddb1197c3b1f",
+ "hash": "ab89ee70d4aee0b8dc5ed72ad42e16e98a8ec9c2eea1e03d99b50c25bbc5a806",
"model": "default",
"page": 1
}
@@ -44,52 +44,6 @@
"name": "Table",
"type": "table",
"$ref": "#/tables/0"
- },
- {
- "prov": [
- {
- "bbox": [
- 238.78076,
- 124.28821000000005,
- 540.0,
- 136.57727
- ],
- "page": 1,
- "span": [
- 0,
- 71
- ],
- "__ref_s3_data": null
- }
- ],
- "text": "ehT t se t w strats it modnar emos h t xe t dna t a neh t elba i egam :",
- "type": "paragraph",
- "payload": null,
- "name": "Text",
- "font": null
- },
- {
- "prov": [
- {
- "bbox": [
- 194.03979,
- 72.85058600000002,
- 410.73657,
- 101.89746000000002
- ],
- "page": 1,
- "span": [
- 0,
- 20
- ],
- "__ref_s3_data": null
- }
- ],
- "text": "tset elbat a si sihT",
- "type": "paragraph",
- "payload": null,
- "name": "Text",
- "font": null
}
],
"figures": [],
@@ -98,10 +52,10 @@
"prov": [
{
"bbox": [
- 112.69406127929688,
- 163.70050048828125,
- 470.0718078613281,
- 302.27655029296875
+ 240.90093994140625,
+ 87.64955139160156,
+ 722.950309753418,
+ 334.58026123046875
],
"page": 1,
"span": [
@@ -119,22 +73,39 @@
"data": [
[
{
- "bbox": null,
+ "bbox": [
+ 97.33333333333337,
+ 105.66666666666669,
+ 190.0,
+ 126.33333333333337
+ ],
"spans": [
[
0,
0
]
],
- "text": "",
- "type": "body"
+ "text": "Vertically merged",
+ "type": "col_header",
+ "col": 0,
+ "col-header": true,
+ "col-span": [
+ 0,
+ 1
+ ],
+ "row": 0,
+ "row-header": false,
+ "row-span": [
+ 0,
+ 1
+ ]
},
{
"bbox": [
- 303.0,
- 508.3333333333333,
- 329.0,
- 517.0
+ 232.33333333333326,
+ 105.66666666666669,
+ 363.6666666666667,
+ 126.33333333333337
],
"spans": [
[
@@ -142,7 +113,7 @@
1
]
],
- "text": "other don't",
+ "text": "Other merged column",
"type": "col_header",
"col": 1,
"col-header": true,
@@ -159,10 +130,10 @@
},
{
"bbox": [
- 422.6666666666667,
- 508.3333333333333,
- 451.6666666666667,
- 517.0
+ 406.3333333333333,
+ 105.66666666666669,
+ 518.0,
+ 121.66666666666663
],
"spans": [
[
@@ -170,7 +141,7 @@
2
]
],
- "text": "Some other row",
+ "text": "Yet another column",
"type": "col_header",
"col": 2,
"col-header": true,
@@ -189,10 +160,10 @@
[
{
"bbox": [
- 190.0,
- 554.6666666666666,
- 213.66666666666666,
- 563.3333333333334
+ 121.66666666666663,
+ 204.0,
+ 168.66666666666663,
+ 220.0
],
"spans": [
[
@@ -200,8 +171,8 @@
0
]
],
- "text": "have content",
- "type": "row_header",
+ "text": "value",
+ "type": "body",
"col": 0,
"col-header": false,
"col-span": [
@@ -209,7 +180,7 @@
1
],
"row": 1,
- "row-header": true,
+ "row-header": false,
"row-span": [
1,
2
@@ -217,10 +188,10 @@
},
{
"bbox": [
- 299.0,
- 554.6666666666666,
- 326.33333333333337,
- 561.0
+ 247.0,
+ 188.0,
+ 349.6666666666667,
+ 204.0
],
"spans": [
[
@@ -228,7 +199,7 @@
1
]
],
- "text": "some cell",
+ "text": "Some other value",
"type": "body",
"col": 1,
"col-header": false,
@@ -246,9 +217,9 @@
{
"bbox": [
408.3333333333333,
- 554.6666666666666,
- 437.3333333333333,
- 563.3333333333334
+ 188.0,
+ 514.0,
+ 204.0
],
"spans": [
[
@@ -256,7 +227,7 @@
2
]
],
- "text": "Some row",
+ "text": "Yet another value",
"type": "body",
"col": 2,
"col-header": false,
@@ -275,10 +246,10 @@
[
{
"bbox": [
- 201.66666666666669,
- 601.0,
- 230.66666666666666,
- 609.6666666666666
+ 121.66666666666663,
+ 284.0,
+ 168.66666666666663,
+ 300.0
],
"spans": [
[
@@ -286,8 +257,8 @@
0
]
],
- "text": "Some other column",
- "type": "row_header",
+ "text": "value",
+ "type": "body",
"col": 0,
"col-header": false,
"col-span": [
@@ -295,7 +266,7 @@
1
],
"row": 2,
- "row-header": true,
+ "row-header": false,
"row-span": [
2,
3
@@ -303,10 +274,10 @@
},
{
"bbox": [
- 308.0,
- 601.0,
- 337.0,
- 609.6666666666666
+ 247.0,
+ 268.0,
+ 349.6666666666667,
+ 284.0
],
"spans": [
[
@@ -314,7 +285,7 @@
1
]
],
- "text": "Some column",
+ "text": "Some other value",
"type": "body",
"col": 1,
"col-header": false,
@@ -330,15 +301,32 @@
]
},
{
- "bbox": null,
+ "bbox": [
+ 408.3333333333333,
+ 268.0,
+ 514.0,
+ 284.0
+ ],
"spans": [
[
2,
2
]
],
- "text": "",
- "type": "body"
+ "text": "Yet another value",
+ "type": "body",
+ "col": 2,
+ "col-header": false,
+ "col-span": [
+ 2,
+ 3
+ ],
+ "row": 2,
+ "row-header": false,
+ "row-span": [
+ 2,
+ 3
+ ]
}
]
],
@@ -351,9 +339,9 @@
"footnotes": [],
"page-dimensions": [
{
- "height": 792.0,
+ "height": 612.0,
"page": 1,
- "width": 612.0
+ "width": 792.0
}
],
"page-footers": [],
diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_180.md b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_180.md
index 8521b3f9..e3d7c0b8 100644
--- a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_180.md
+++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_180.md
@@ -1,5 +1,4 @@
-| inside | | nothing | and last row 2 |
-|----------|--------------|------------|------------------|
-| have | other | | and row 1 |
-| and | have content | some cells | this is row 0 |
-| Column 2 | Column 1 | Column 0 | |
\ No newline at end of file
+| Vertically merged | Other merged column | Yet another column |
+|---------------------|-----------------------|----------------------|
+| value | Some other value | Yet another value |
+| value | Some other value | Yet another value |
\ No newline at end of file
diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_180.pages.json b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_180.pages.json
index c8d38184..de743661 100644
--- a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_180.pages.json
+++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_180.pages.json
@@ -2,8 +2,8 @@
{
"page_no": 0,
"size": {
- "width": 612.0,
- "height": 792.0
+ "width": 792.0,
+ "height": 612.0
},
"parsed_page": {
"dimension": {
@@ -11,47 +11,47 @@
"rect": {
"r_x0": 0.0,
"r_y0": 0.0,
- "r_x1": 612.0,
+ "r_x1": 792.0,
"r_y1": 0.0,
- "r_x2": 612.0,
- "r_y2": 792.0,
+ "r_x2": 792.0,
+ "r_y2": 612.0,
"r_x3": 0.0,
- "r_y3": 792.0,
+ "r_y3": 612.0,
"coord_origin": "BOTTOMLEFT"
},
"boundary_type": "crop_box",
"art_bbox": {
"l": 0.0,
- "t": 792.0,
- "r": 612.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
},
"bleed_bbox": {
"l": 0.0,
- "t": 792.0,
- "r": 612.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
},
"crop_bbox": {
"l": 0.0,
- "t": 792.0,
- "r": 612.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
},
"media_bbox": {
"l": 0.0,
- "t": 792.0,
- "r": 612.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
},
"trim_bbox": {
"l": 0.0,
- "t": 792.0,
- "r": 612.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
}
@@ -69,21 +69,21 @@
"a": 255
},
"rect": {
- "r_x0": 194.03979,
- "r_y0": 719.149414,
- "r_x1": 410.73657,
- "r_y1": 719.149414,
- "r_x2": 410.73657,
- "r_y2": 690.10254,
- "r_x3": 194.03979,
- "r_y3": 690.10254,
+ "r_x0": 694.6666666666666,
+ "r_y0": 485.66666666666663,
+ "r_x1": 602.0,
+ "r_y1": 485.66666666666663,
+ "r_x2": 602.0,
+ "r_y2": 506.3333333333333,
+ "r_x3": 694.6666666666666,
+ "r_y3": 506.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": " tset elbat a si sihT",
- "orig": " tset elbat a si sihT",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
},
{
"index": 1,
@@ -94,21 +94,21 @@
"a": 255
},
"rect": {
- "r_x0": 521.0545,
- "r_y0": 667.71179,
- "r_x1": 540.0,
- "r_y1": 667.71179,
- "r_x2": 540.0,
- "r_y2": 655.42273,
- "r_x3": 521.0545,
- "r_y3": 655.42273,
+ "r_x0": 680.0,
+ "r_y0": 454.33333333333337,
+ "r_x1": 610.0,
+ "r_y1": 454.33333333333337,
+ "r_x2": 610.0,
+ "r_y2": 475.0,
+ "r_x3": 680.0,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "ehT",
- "orig": "ehT",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
},
{
"index": 2,
@@ -119,21 +119,21 @@
"a": 255
},
"rect": {
- "r_x0": 518.00269,
- "r_y0": 667.71179,
- "r_x1": 518.00488,
- "r_y1": 667.71179,
- "r_x2": 518.00488,
- "r_y2": 655.42273,
- "r_x3": 518.00269,
- "r_y3": 655.42273,
+ "r_x0": 670.3333333333334,
+ "r_y0": 392.0,
+ "r_x1": 623.3333333333334,
+ "r_y1": 392.0,
+ "r_x2": 623.3333333333334,
+ "r_y2": 408.0,
+ "r_x3": 670.3333333333334,
+ "r_y3": 408.0,
"coord_origin": "TOPLEFT"
},
- "text": " t",
- "orig": " t",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 3,
@@ -144,21 +144,21 @@
"a": 255
},
"rect": {
- "r_x0": 503.33759000000003,
- "r_y0": 667.71179,
- "r_x1": 514.95093,
- "r_y1": 667.71179,
- "r_x2": 514.95093,
- "r_y2": 655.42273,
- "r_x3": 503.33759000000003,
- "r_y3": 655.42273,
+ "r_x0": 670.3333333333334,
+ "r_y0": 312.0,
+ "r_x1": 623.3333333333334,
+ "r_y1": 312.0,
+ "r_x2": 623.3333333333334,
+ "r_y2": 328.0,
+ "r_x3": 670.3333333333334,
+ "r_y3": 328.0,
"coord_origin": "TOPLEFT"
},
- "text": "se",
- "orig": "se",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 4,
@@ -169,21 +169,21 @@
"a": 255
},
"rect": {
- "r_x0": 500.28534,
- "r_y0": 667.71179,
- "r_x1": 500.28751,
- "r_y1": 667.71179,
- "r_x2": 500.28751,
- "r_y2": 655.42273,
- "r_x3": 500.28534,
- "r_y3": 655.42273,
+ "r_x0": 559.6666666666667,
+ "r_y0": 485.66666666666663,
+ "r_x1": 428.3333333333333,
+ "r_y1": 485.66666666666663,
+ "r_x2": 428.3333333333333,
+ "r_y2": 506.3333333333333,
+ "r_x3": 559.6666666666667,
+ "r_y3": 506.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "t ",
- "orig": "t ",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 5,
@@ -194,21 +194,21 @@
"a": 255
},
"rect": {
- "r_x0": 459.36172000000005,
- "r_y0": 667.71179,
- "r_x1": 497.23352,
- "r_y1": 667.71179,
- "r_x2": 497.23352,
- "r_y2": 655.42273,
- "r_x3": 459.36172000000005,
- "r_y3": 655.42273,
+ "r_x0": 526.6666666666667,
+ "r_y0": 459.0,
+ "r_x1": 456.0,
+ "r_y1": 459.0,
+ "r_x2": 456.0,
+ "r_y2": 475.0,
+ "r_x3": 526.6666666666667,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "w strats",
- "orig": "w strats",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 6,
@@ -219,21 +219,21 @@
"a": 255
},
"rect": {
- "r_x0": 456.92352,
- "r_y0": 667.71179,
- "r_x1": 456.92526,
- "r_y1": 667.71179,
- "r_x2": 456.92526,
- "r_y2": 655.42273,
- "r_x3": 456.92352,
- "r_y3": 655.42273,
+ "r_x0": 545.0,
+ "r_y0": 408.0,
+ "r_x1": 442.3333333333333,
+ "r_y1": 408.0,
+ "r_x2": 442.3333333333333,
+ "r_y2": 424.0,
+ "r_x3": 545.0,
+ "r_y3": 424.0,
"coord_origin": "TOPLEFT"
},
- "text": "it",
- "orig": "it",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 91.0,
+ "from_ocr": true
},
{
"index": 7,
@@ -244,21 +244,21 @@
"a": 255
},
"rect": {
- "r_x0": 377.49374,
- "r_y0": 667.71179,
- "r_x1": 453.87128,
- "r_y1": 667.71179,
- "r_x2": 453.87128,
- "r_y2": 655.42273,
- "r_x3": 377.49374,
- "r_y3": 655.42273,
+ "r_x0": 515.0,
+ "r_y0": 376.0,
+ "r_x1": 468.0,
+ "r_y1": 376.0,
+ "r_x2": 468.0,
+ "r_y2": 392.0,
+ "r_x3": 515.0,
+ "r_y3": 392.0,
"coord_origin": "TOPLEFT"
},
- "text": "modnar emos h",
- "orig": "modnar emos h",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 8,
@@ -269,21 +269,21 @@
"a": 255
},
"rect": {
- "r_x0": 374.44409,
- "r_y0": 667.71179,
- "r_x1": 374.44629,
- "r_y1": 667.71179,
- "r_x2": 374.44629,
- "r_y2": 655.42273,
- "r_x3": 374.44409,
- "r_y3": 655.42273,
+ "r_x0": 545.0,
+ "r_y0": 328.0,
+ "r_x1": 442.3333333333333,
+ "r_y1": 328.0,
+ "r_x2": 442.3333333333333,
+ "r_y2": 344.0,
+ "r_x3": 545.0,
+ "r_y3": 344.0,
"coord_origin": "TOPLEFT"
},
- "text": " t",
- "orig": " t",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 9,
@@ -294,21 +294,21 @@
"a": 255
},
"rect": {
- "r_x0": 359.77896,
- "r_y0": 667.71179,
- "r_x1": 371.3923,
- "r_y1": 667.71179,
- "r_x2": 371.3923,
- "r_y2": 655.42273,
- "r_x3": 359.77896,
- "r_y3": 655.42273,
+ "r_x0": 515.0,
+ "r_y0": 296.6666666666667,
+ "r_x1": 468.0,
+ "r_y1": 296.6666666666667,
+ "r_x2": 468.0,
+ "r_y2": 312.6666666666667,
+ "r_x3": 515.0,
+ "r_y3": 312.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "xe",
- "orig": "xe",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 10,
@@ -319,21 +319,21 @@
"a": 255
},
"rect": {
- "r_x0": 356.72672,
- "r_y0": 667.71179,
- "r_x1": 356.72888,
- "r_y1": 667.71179,
- "r_x2": 356.72888,
- "r_y2": 655.42273,
- "r_x3": 356.72672,
- "r_y3": 655.42273,
+ "r_x0": 385.6666666666667,
+ "r_y0": 490.33333333333337,
+ "r_x1": 274.0,
+ "r_y1": 490.33333333333337,
+ "r_x2": 274.0,
+ "r_y2": 506.3333333333333,
+ "r_x3": 385.6666666666667,
+ "r_y3": 506.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "t ",
- "orig": "t ",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 11,
@@ -344,21 +344,21 @@
"a": 255
},
"rect": {
- "r_x0": 335.3306,
- "r_y0": 667.71179,
- "r_x1": 353.67493,
- "r_y1": 667.71179,
- "r_x2": 353.67493,
- "r_y2": 655.42273,
- "r_x3": 335.3306,
- "r_y3": 655.42273,
+ "r_x0": 363.0,
+ "r_y0": 459.0,
+ "r_x1": 292.66666666666663,
+ "r_y1": 459.0,
+ "r_x2": 292.66666666666663,
+ "r_y2": 475.0,
+ "r_x3": 363.0,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "dna",
- "orig": "dna",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 12,
@@ -369,21 +369,21 @@
"a": 255
},
"rect": {
- "r_x0": 332.27878,
- "r_y0": 667.71179,
- "r_x1": 332.28094,
- "r_y1": 667.71179,
- "r_x2": 332.28094,
- "r_y2": 655.42273,
- "r_x3": 332.27878,
- "r_y3": 655.42273,
+ "r_x0": 383.6666666666667,
+ "r_y0": 408.0,
+ "r_x1": 278.0,
+ "r_y1": 408.0,
+ "r_x2": 278.0,
+ "r_y2": 424.0,
+ "r_x3": 383.6666666666667,
+ "r_y3": 424.0,
"coord_origin": "TOPLEFT"
},
- "text": " t",
- "orig": " t",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 13,
@@ -394,21 +394,21 @@
"a": 255
},
"rect": {
- "r_x0": 301.7153,
- "r_y0": 667.71179,
- "r_x1": 329.22699,
- "r_y1": 667.71179,
- "r_x2": 329.22699,
- "r_y2": 655.42273,
- "r_x3": 301.7153,
- "r_y3": 655.42273,
+ "r_x0": 351.33333333333337,
+ "r_y0": 376.0,
+ "r_x1": 304.33333333333337,
+ "r_y1": 376.0,
+ "r_x2": 304.33333333333337,
+ "r_y2": 392.0,
+ "r_x3": 351.33333333333337,
+ "r_y3": 392.0,
"coord_origin": "TOPLEFT"
},
- "text": "a neh",
- "orig": "a neh",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 14,
@@ -419,21 +419,21 @@
"a": 255
},
"rect": {
- "r_x0": 298.66348,
- "r_y0": 667.71179,
- "r_x1": 298.66565,
- "r_y1": 667.71179,
- "r_x2": 298.66565,
- "r_y2": 655.42273,
- "r_x3": 298.66348,
- "r_y3": 655.42273,
+ "r_x0": 383.6666666666667,
+ "r_y0": 328.0,
+ "r_x1": 278.0,
+ "r_y1": 328.0,
+ "r_x2": 278.0,
+ "r_y2": 344.0,
+ "r_x3": 383.6666666666667,
+ "r_y3": 344.0,
"coord_origin": "TOPLEFT"
},
- "text": " t",
- "orig": " t",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 15,
@@ -444,495 +444,20 @@
"a": 255
},
"rect": {
- "r_x0": 274.82526,
- "r_y0": 667.71179,
- "r_x1": 295.61169,
- "r_y1": 667.71179,
- "r_x2": 295.61169,
- "r_y2": 655.42273,
- "r_x3": 274.82526,
- "r_y3": 655.42273,
+ "r_x0": 351.33333333333337,
+ "r_y0": 296.6666666666667,
+ "r_x1": 304.33333333333337,
+ "r_y1": 296.6666666666667,
+ "r_x2": 304.33333333333337,
+ "r_y2": 312.6666666666667,
+ "r_x3": 351.33333333333337,
+ "r_y3": 312.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "elba",
- "orig": "elba",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- },
- {
- "index": 16,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 271.77344,
- "r_y0": 667.71179,
- "r_x1": 271.7756,
- "r_y1": 667.71179,
- "r_x2": 271.7756,
- "r_y2": 655.42273,
- "r_x3": 271.77344,
- "r_y3": 655.42273,
- "coord_origin": "TOPLEFT"
- },
- "text": " i",
- "orig": " i",
- "text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- },
- {
- "index": 17,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 241.83258,
- "r_y0": 667.71179,
- "r_x1": 269.3335,
- "r_y1": 667.71179,
- "r_x2": 269.3335,
- "r_y2": 655.42273,
- "r_x3": 241.83258,
- "r_y3": 655.42273,
- "coord_origin": "TOPLEFT"
- },
- "text": "egam",
- "orig": "egam",
- "text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- },
- {
- "index": 18,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 238.78076,
- "r_y0": 667.71179,
- "r_x1": 238.78296,
- "r_y1": 667.71179,
- "r_x2": 238.78296,
- "r_y2": 655.42273,
- "r_x3": 238.78076,
- "r_y3": 655.42273,
- "coord_origin": "TOPLEFT"
- },
- "text": ": ",
- "orig": ": ",
- "text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- },
- {
- "index": 19,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 337.0,
- "r_y0": 601.0,
- "r_x1": 308.0,
- "r_y1": 601.0,
- "r_x2": 308.0,
- "r_y2": 609.6666666666666,
- "r_x3": 337.0,
- "r_y3": 609.6666666666666,
- "coord_origin": "TOPLEFT"
- },
- "text": "Some",
- "orig": "Some",
- "text_direction": "left_to_right",
- "confidence": 0.95841644,
- "from_ocr": true
- },
- {
- "index": 20,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 304.0,
- "r_y0": 601.0,
- "r_x1": 268.33333333333337,
- "r_y1": 601.0,
- "r_x2": 268.33333333333337,
- "r_y2": 609.3333333333334,
- "r_x3": 304.0,
- "r_y3": 609.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "column",
- "orig": "column",
- "text_direction": "left_to_right",
- "confidence": 0.95624527,
- "from_ocr": true
- },
- {
- "index": 21,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 230.66666666666666,
- "r_y0": 601.0,
- "r_x1": 201.66666666666669,
- "r_y1": 601.0,
- "r_x2": 201.66666666666669,
- "r_y2": 609.6666666666666,
- "r_x3": 230.66666666666666,
- "r_y3": 609.6666666666666,
- "coord_origin": "TOPLEFT"
- },
- "text": "Some",
- "orig": "Some",
- "text_direction": "left_to_right",
- "confidence": 0.96296555,
- "from_ocr": true
- },
- {
- "index": 22,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 197.66666666666669,
- "r_y0": 601.0,
- "r_x1": 172.0,
- "r_y1": 601.0,
- "r_x2": 172.0,
- "r_y2": 609.3333333333334,
- "r_x3": 197.66666666666669,
- "r_y3": 609.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.96467484,
- "from_ocr": true
- },
- {
- "index": 23,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 168.66666666666669,
- "r_y0": 601.0,
- "r_x1": 133.0,
- "r_y1": 601.0,
- "r_x2": 133.0,
- "r_y2": 609.3333333333334,
- "r_x3": 168.66666666666669,
- "r_y3": 609.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "column",
- "orig": "column",
- "text_direction": "left_to_right",
- "confidence": 0.95497986,
- "from_ocr": true
- },
- {
- "index": 24,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 437.3333333333333,
- "r_y0": 554.6666666666666,
- "r_x1": 408.3333333333333,
- "r_y1": 554.6666666666666,
- "r_x2": 408.3333333333333,
- "r_y2": 563.3333333333334,
- "r_x3": 437.3333333333333,
- "r_y3": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "Some",
- "orig": "Some",
- "text_direction": "left_to_right",
- "confidence": 0.95944489,
- "from_ocr": true
- },
- {
- "index": 25,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 404.0,
- "r_y0": 554.6666666666666,
- "r_x1": 386.3333333333333,
- "r_y1": 554.6666666666666,
- "r_x2": 386.3333333333333,
- "r_y2": 561.0,
- "r_x3": 404.0,
- "r_y3": 561.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "row",
- "orig": "row",
- "text_direction": "left_to_right",
- "confidence": 0.9680950199999999,
- "from_ocr": true
- },
- {
- "index": 26,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 326.33333333333337,
- "r_y0": 554.6666666666666,
- "r_x1": 299.0,
- "r_y1": 554.6666666666666,
- "r_x2": 299.0,
- "r_y2": 561.0,
- "r_x3": 326.33333333333337,
- "r_y3": 561.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "some",
- "orig": "some",
- "text_direction": "left_to_right",
- "confidence": 0.9569136,
- "from_ocr": true
- },
- {
- "index": 27,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 295.33333333333337,
- "r_y0": 554.6666666666666,
- "r_x1": 279.0,
- "r_y1": 554.6666666666666,
- "r_x2": 279.0,
- "r_y2": 563.3333333333334,
- "r_x3": 295.33333333333337,
- "r_y3": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "cell",
- "orig": "cell",
- "text_direction": "left_to_right",
- "confidence": 0.9622145799999999,
- "from_ocr": true
- },
- {
- "index": 28,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 213.66666666666666,
- "r_y0": 554.6666666666666,
- "r_x1": 190.0,
- "r_y1": 554.6666666666666,
- "r_x2": 190.0,
- "r_y2": 563.3333333333334,
- "r_x3": 213.66666666666666,
- "r_y3": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "have",
- "orig": "have",
- "text_direction": "left_to_right",
- "confidence": 0.96403,
- "from_ocr": true
- },
- {
- "index": 29,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 186.0,
- "r_y0": 554.6666666666666,
- "r_x1": 149.0,
- "r_y1": 554.6666666666666,
- "r_x2": 149.0,
- "r_y2": 563.0,
- "r_x3": 186.0,
- "r_y3": 563.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "content",
- "orig": "content",
- "text_direction": "left_to_right",
- "confidence": 0.96691612,
- "from_ocr": true
- },
- {
- "index": 30,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 451.6666666666667,
- "r_y0": 508.3333333333333,
- "r_x1": 422.6666666666667,
- "r_y1": 508.3333333333333,
- "r_x2": 422.6666666666667,
- "r_y2": 517.0,
- "r_x3": 451.6666666666667,
- "r_y3": 517.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "Some",
- "orig": "Some",
- "text_direction": "left_to_right",
- "confidence": 0.9684503200000001,
- "from_ocr": true
- },
- {
- "index": 31,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 419.0,
- "r_y0": 508.3333333333333,
- "r_x1": 393.0,
- "r_y1": 508.3333333333333,
- "r_x2": 393.0,
- "r_y2": 516.6666666666666,
- "r_x3": 419.0,
- "r_y3": 516.6666666666666,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.96073517,
- "from_ocr": true
- },
- {
- "index": 32,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 389.3333333333333,
- "r_y0": 508.3333333333333,
- "r_x1": 371.6666666666667,
- "r_y1": 508.3333333333333,
- "r_x2": 371.6666666666667,
- "r_y2": 514.6666666666666,
- "r_x3": 389.3333333333333,
- "r_y3": 514.6666666666666,
- "coord_origin": "TOPLEFT"
- },
- "text": "row",
- "orig": "row",
- "text_direction": "left_to_right",
- "confidence": 0.9615368700000001,
- "from_ocr": true
- },
- {
- "index": 33,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 329.0,
- "r_y0": 508.3333333333333,
- "r_x1": 303.0,
- "r_y1": 508.3333333333333,
- "r_x2": 303.0,
- "r_y2": 517.0,
- "r_x3": 329.0,
- "r_y3": 517.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.9626261100000001,
- "from_ocr": true
- },
- {
- "index": 34,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 299.66666666666663,
- "r_y0": 508.3333333333333,
- "r_x1": 275.66666666666663,
- "r_y1": 508.3333333333333,
- "r_x2": 275.66666666666663,
- "r_y2": 517.0,
- "r_x3": 299.66666666666663,
- "r_y3": 517.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "don't",
- "orig": "don't",
- "text_direction": "left_to_right",
- "confidence": 0.96669136,
+ "confidence": 95.0,
"from_ocr": true
}
],
@@ -946,16 +471,16 @@
"layout": {
"clusters": [
{
- "id": 8,
- "label": "text",
+ "id": 0,
+ "label": "table",
"bbox": {
- "l": 194.03979,
- "t": 690.10254,
- "r": 410.73657,
- "b": 719.149414,
+ "l": 240.90093994140625,
+ "t": 277.41973876953125,
+ "r": 722.950309753418,
+ "b": 524.3504486083984,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7134009003639221,
+ "confidence": 0.9790865778923035,
"cells": [
{
"index": 0,
@@ -966,37 +491,22 @@
"a": 255
},
"rect": {
- "r_x0": 194.03979,
- "r_y0": 719.149414,
- "r_x1": 410.73657,
- "r_y1": 719.149414,
- "r_x2": 410.73657,
- "r_y2": 690.10254,
- "r_x3": 194.03979,
- "r_y3": 690.10254,
+ "r_x0": 694.6666666666666,
+ "r_y0": 485.66666666666663,
+ "r_x1": 602.0,
+ "r_y1": 485.66666666666663,
+ "r_x2": 602.0,
+ "r_y2": 506.3333333333333,
+ "r_x3": 694.6666666666666,
+ "r_y3": 506.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": " tset elbat a si sihT",
- "orig": " tset elbat a si sihT",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- }
- ],
- "children": []
- },
- {
- "id": 0,
- "label": "text",
- "bbox": {
- "l": 238.78076,
- "t": 655.42273,
- "r": 540.0,
- "b": 667.71179,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.8374139070510864,
- "cells": [
+ "confidence": 90.0,
+ "from_ocr": true
+ },
{
"index": 1,
"rgba": {
@@ -1006,21 +516,21 @@
"a": 255
},
"rect": {
- "r_x0": 521.0545,
- "r_y0": 667.71179,
- "r_x1": 540.0,
- "r_y1": 667.71179,
- "r_x2": 540.0,
- "r_y2": 655.42273,
- "r_x3": 521.0545,
- "r_y3": 655.42273,
+ "r_x0": 680.0,
+ "r_y0": 454.33333333333337,
+ "r_x1": 610.0,
+ "r_y1": 454.33333333333337,
+ "r_x2": 610.0,
+ "r_y2": 475.0,
+ "r_x3": 680.0,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "ehT",
- "orig": "ehT",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
},
{
"index": 2,
@@ -1031,21 +541,21 @@
"a": 255
},
"rect": {
- "r_x0": 518.00269,
- "r_y0": 667.71179,
- "r_x1": 518.00488,
- "r_y1": 667.71179,
- "r_x2": 518.00488,
- "r_y2": 655.42273,
- "r_x3": 518.00269,
- "r_y3": 655.42273,
+ "r_x0": 670.3333333333334,
+ "r_y0": 392.0,
+ "r_x1": 623.3333333333334,
+ "r_y1": 392.0,
+ "r_x2": 623.3333333333334,
+ "r_y2": 408.0,
+ "r_x3": 670.3333333333334,
+ "r_y3": 408.0,
"coord_origin": "TOPLEFT"
},
- "text": " t",
- "orig": " t",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 3,
@@ -1056,21 +566,21 @@
"a": 255
},
"rect": {
- "r_x0": 503.33759000000003,
- "r_y0": 667.71179,
- "r_x1": 514.95093,
- "r_y1": 667.71179,
- "r_x2": 514.95093,
- "r_y2": 655.42273,
- "r_x3": 503.33759000000003,
- "r_y3": 655.42273,
+ "r_x0": 670.3333333333334,
+ "r_y0": 312.0,
+ "r_x1": 623.3333333333334,
+ "r_y1": 312.0,
+ "r_x2": 623.3333333333334,
+ "r_y2": 328.0,
+ "r_x3": 670.3333333333334,
+ "r_y3": 328.0,
"coord_origin": "TOPLEFT"
},
- "text": "se",
- "orig": "se",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 4,
@@ -1081,21 +591,21 @@
"a": 255
},
"rect": {
- "r_x0": 500.28534,
- "r_y0": 667.71179,
- "r_x1": 500.28751,
- "r_y1": 667.71179,
- "r_x2": 500.28751,
- "r_y2": 655.42273,
- "r_x3": 500.28534,
- "r_y3": 655.42273,
+ "r_x0": 559.6666666666667,
+ "r_y0": 485.66666666666663,
+ "r_x1": 428.3333333333333,
+ "r_y1": 485.66666666666663,
+ "r_x2": 428.3333333333333,
+ "r_y2": 506.3333333333333,
+ "r_x3": 559.6666666666667,
+ "r_y3": 506.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "t ",
- "orig": "t ",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 5,
@@ -1106,21 +616,21 @@
"a": 255
},
"rect": {
- "r_x0": 459.36172000000005,
- "r_y0": 667.71179,
- "r_x1": 497.23352,
- "r_y1": 667.71179,
- "r_x2": 497.23352,
- "r_y2": 655.42273,
- "r_x3": 459.36172000000005,
- "r_y3": 655.42273,
+ "r_x0": 526.6666666666667,
+ "r_y0": 459.0,
+ "r_x1": 456.0,
+ "r_y1": 459.0,
+ "r_x2": 456.0,
+ "r_y2": 475.0,
+ "r_x3": 526.6666666666667,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "w strats",
- "orig": "w strats",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 6,
@@ -1131,21 +641,21 @@
"a": 255
},
"rect": {
- "r_x0": 456.92352,
- "r_y0": 667.71179,
- "r_x1": 456.92526,
- "r_y1": 667.71179,
- "r_x2": 456.92526,
- "r_y2": 655.42273,
- "r_x3": 456.92352,
- "r_y3": 655.42273,
+ "r_x0": 545.0,
+ "r_y0": 408.0,
+ "r_x1": 442.3333333333333,
+ "r_y1": 408.0,
+ "r_x2": 442.3333333333333,
+ "r_y2": 424.0,
+ "r_x3": 545.0,
+ "r_y3": 424.0,
"coord_origin": "TOPLEFT"
},
- "text": "it",
- "orig": "it",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 91.0,
+ "from_ocr": true
},
{
"index": 7,
@@ -1156,21 +666,21 @@
"a": 255
},
"rect": {
- "r_x0": 377.49374,
- "r_y0": 667.71179,
- "r_x1": 453.87128,
- "r_y1": 667.71179,
- "r_x2": 453.87128,
- "r_y2": 655.42273,
- "r_x3": 377.49374,
- "r_y3": 655.42273,
+ "r_x0": 515.0,
+ "r_y0": 376.0,
+ "r_x1": 468.0,
+ "r_y1": 376.0,
+ "r_x2": 468.0,
+ "r_y2": 392.0,
+ "r_x3": 515.0,
+ "r_y3": 392.0,
"coord_origin": "TOPLEFT"
},
- "text": "modnar emos h",
- "orig": "modnar emos h",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 8,
@@ -1181,21 +691,21 @@
"a": 255
},
"rect": {
- "r_x0": 374.44409,
- "r_y0": 667.71179,
- "r_x1": 374.44629,
- "r_y1": 667.71179,
- "r_x2": 374.44629,
- "r_y2": 655.42273,
- "r_x3": 374.44409,
- "r_y3": 655.42273,
+ "r_x0": 545.0,
+ "r_y0": 328.0,
+ "r_x1": 442.3333333333333,
+ "r_y1": 328.0,
+ "r_x2": 442.3333333333333,
+ "r_y2": 344.0,
+ "r_x3": 545.0,
+ "r_y3": 344.0,
"coord_origin": "TOPLEFT"
},
- "text": " t",
- "orig": " t",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 9,
@@ -1206,21 +716,21 @@
"a": 255
},
"rect": {
- "r_x0": 359.77896,
- "r_y0": 667.71179,
- "r_x1": 371.3923,
- "r_y1": 667.71179,
- "r_x2": 371.3923,
- "r_y2": 655.42273,
- "r_x3": 359.77896,
- "r_y3": 655.42273,
+ "r_x0": 515.0,
+ "r_y0": 296.6666666666667,
+ "r_x1": 468.0,
+ "r_y1": 296.6666666666667,
+ "r_x2": 468.0,
+ "r_y2": 312.6666666666667,
+ "r_x3": 515.0,
+ "r_y3": 312.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "xe",
- "orig": "xe",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 10,
@@ -1231,21 +741,21 @@
"a": 255
},
"rect": {
- "r_x0": 356.72672,
- "r_y0": 667.71179,
- "r_x1": 356.72888,
- "r_y1": 667.71179,
- "r_x2": 356.72888,
- "r_y2": 655.42273,
- "r_x3": 356.72672,
- "r_y3": 655.42273,
+ "r_x0": 385.6666666666667,
+ "r_y0": 490.33333333333337,
+ "r_x1": 274.0,
+ "r_y1": 490.33333333333337,
+ "r_x2": 274.0,
+ "r_y2": 506.3333333333333,
+ "r_x3": 385.6666666666667,
+ "r_y3": 506.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "t ",
- "orig": "t ",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 11,
@@ -1256,21 +766,21 @@
"a": 255
},
"rect": {
- "r_x0": 335.3306,
- "r_y0": 667.71179,
- "r_x1": 353.67493,
- "r_y1": 667.71179,
- "r_x2": 353.67493,
- "r_y2": 655.42273,
- "r_x3": 335.3306,
- "r_y3": 655.42273,
+ "r_x0": 363.0,
+ "r_y0": 459.0,
+ "r_x1": 292.66666666666663,
+ "r_y1": 459.0,
+ "r_x2": 292.66666666666663,
+ "r_y2": 475.0,
+ "r_x3": 363.0,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "dna",
- "orig": "dna",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 12,
@@ -1281,21 +791,21 @@
"a": 255
},
"rect": {
- "r_x0": 332.27878,
- "r_y0": 667.71179,
- "r_x1": 332.28094,
- "r_y1": 667.71179,
- "r_x2": 332.28094,
- "r_y2": 655.42273,
- "r_x3": 332.27878,
- "r_y3": 655.42273,
+ "r_x0": 383.6666666666667,
+ "r_y0": 408.0,
+ "r_x1": 278.0,
+ "r_y1": 408.0,
+ "r_x2": 278.0,
+ "r_y2": 424.0,
+ "r_x3": 383.6666666666667,
+ "r_y3": 424.0,
"coord_origin": "TOPLEFT"
},
- "text": " t",
- "orig": " t",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 13,
@@ -1306,21 +816,21 @@
"a": 255
},
"rect": {
- "r_x0": 301.7153,
- "r_y0": 667.71179,
- "r_x1": 329.22699,
- "r_y1": 667.71179,
- "r_x2": 329.22699,
- "r_y2": 655.42273,
- "r_x3": 301.7153,
- "r_y3": 655.42273,
+ "r_x0": 351.33333333333337,
+ "r_y0": 376.0,
+ "r_x1": 304.33333333333337,
+ "r_y1": 376.0,
+ "r_x2": 304.33333333333337,
+ "r_y2": 392.0,
+ "r_x3": 351.33333333333337,
+ "r_y3": 392.0,
"coord_origin": "TOPLEFT"
},
- "text": "a neh",
- "orig": "a neh",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 14,
@@ -1331,21 +841,21 @@
"a": 255
},
"rect": {
- "r_x0": 298.66348,
- "r_y0": 667.71179,
- "r_x1": 298.66565,
- "r_y1": 667.71179,
- "r_x2": 298.66565,
- "r_y2": 655.42273,
- "r_x3": 298.66348,
- "r_y3": 655.42273,
+ "r_x0": 383.6666666666667,
+ "r_y0": 328.0,
+ "r_x1": 278.0,
+ "r_y1": 328.0,
+ "r_x2": 278.0,
+ "r_y2": 344.0,
+ "r_x3": 383.6666666666667,
+ "r_y3": 344.0,
"coord_origin": "TOPLEFT"
},
- "text": " t",
- "orig": " t",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 15,
@@ -1356,593 +866,38 @@
"a": 255
},
"rect": {
- "r_x0": 274.82526,
- "r_y0": 667.71179,
- "r_x1": 295.61169,
- "r_y1": 667.71179,
- "r_x2": 295.61169,
- "r_y2": 655.42273,
- "r_x3": 274.82526,
- "r_y3": 655.42273,
+ "r_x0": 351.33333333333337,
+ "r_y0": 296.6666666666667,
+ "r_x1": 304.33333333333337,
+ "r_y1": 296.6666666666667,
+ "r_x2": 304.33333333333337,
+ "r_y2": 312.6666666666667,
+ "r_x3": 351.33333333333337,
+ "r_y3": 312.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "elba",
- "orig": "elba",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- },
- {
- "index": 16,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 271.77344,
- "r_y0": 667.71179,
- "r_x1": 271.7756,
- "r_y1": 667.71179,
- "r_x2": 271.7756,
- "r_y2": 655.42273,
- "r_x3": 271.77344,
- "r_y3": 655.42273,
- "coord_origin": "TOPLEFT"
- },
- "text": " i",
- "orig": " i",
- "text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- },
- {
- "index": 17,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 241.83258,
- "r_y0": 667.71179,
- "r_x1": 269.3335,
- "r_y1": 667.71179,
- "r_x2": 269.3335,
- "r_y2": 655.42273,
- "r_x3": 241.83258,
- "r_y3": 655.42273,
- "coord_origin": "TOPLEFT"
- },
- "text": "egam",
- "orig": "egam",
- "text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- },
- {
- "index": 18,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 238.78076,
- "r_y0": 667.71179,
- "r_x1": 238.78296,
- "r_y1": 667.71179,
- "r_x2": 238.78296,
- "r_y2": 655.42273,
- "r_x3": 238.78076,
- "r_y3": 655.42273,
- "coord_origin": "TOPLEFT"
- },
- "text": ": ",
- "orig": ": ",
- "text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- }
- ],
- "children": []
- },
- {
- "id": 9,
- "label": "table",
- "bbox": {
- "l": 112.69406127929688,
- "t": 489.72344970703125,
- "r": 470.0718078613281,
- "b": 628.2994995117188,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.6408323049545288,
- "cells": [
- {
- "index": 19,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 337.0,
- "r_y0": 601.0,
- "r_x1": 308.0,
- "r_y1": 601.0,
- "r_x2": 308.0,
- "r_y2": 609.6666666666666,
- "r_x3": 337.0,
- "r_y3": 609.6666666666666,
- "coord_origin": "TOPLEFT"
- },
- "text": "Some",
- "orig": "Some",
- "text_direction": "left_to_right",
- "confidence": 0.95841644,
- "from_ocr": true
- },
- {
- "index": 20,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 304.0,
- "r_y0": 601.0,
- "r_x1": 268.33333333333337,
- "r_y1": 601.0,
- "r_x2": 268.33333333333337,
- "r_y2": 609.3333333333334,
- "r_x3": 304.0,
- "r_y3": 609.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "column",
- "orig": "column",
- "text_direction": "left_to_right",
- "confidence": 0.95624527,
- "from_ocr": true
- },
- {
- "index": 21,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 230.66666666666666,
- "r_y0": 601.0,
- "r_x1": 201.66666666666669,
- "r_y1": 601.0,
- "r_x2": 201.66666666666669,
- "r_y2": 609.6666666666666,
- "r_x3": 230.66666666666666,
- "r_y3": 609.6666666666666,
- "coord_origin": "TOPLEFT"
- },
- "text": "Some",
- "orig": "Some",
- "text_direction": "left_to_right",
- "confidence": 0.96296555,
- "from_ocr": true
- },
- {
- "index": 22,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 197.66666666666669,
- "r_y0": 601.0,
- "r_x1": 172.0,
- "r_y1": 601.0,
- "r_x2": 172.0,
- "r_y2": 609.3333333333334,
- "r_x3": 197.66666666666669,
- "r_y3": 609.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.96467484,
- "from_ocr": true
- },
- {
- "index": 23,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 168.66666666666669,
- "r_y0": 601.0,
- "r_x1": 133.0,
- "r_y1": 601.0,
- "r_x2": 133.0,
- "r_y2": 609.3333333333334,
- "r_x3": 168.66666666666669,
- "r_y3": 609.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "column",
- "orig": "column",
- "text_direction": "left_to_right",
- "confidence": 0.95497986,
- "from_ocr": true
- },
- {
- "index": 24,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 437.3333333333333,
- "r_y0": 554.6666666666666,
- "r_x1": 408.3333333333333,
- "r_y1": 554.6666666666666,
- "r_x2": 408.3333333333333,
- "r_y2": 563.3333333333334,
- "r_x3": 437.3333333333333,
- "r_y3": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "Some",
- "orig": "Some",
- "text_direction": "left_to_right",
- "confidence": 0.95944489,
- "from_ocr": true
- },
- {
- "index": 25,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 404.0,
- "r_y0": 554.6666666666666,
- "r_x1": 386.3333333333333,
- "r_y1": 554.6666666666666,
- "r_x2": 386.3333333333333,
- "r_y2": 561.0,
- "r_x3": 404.0,
- "r_y3": 561.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "row",
- "orig": "row",
- "text_direction": "left_to_right",
- "confidence": 0.9680950199999999,
- "from_ocr": true
- },
- {
- "index": 26,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 326.33333333333337,
- "r_y0": 554.6666666666666,
- "r_x1": 299.0,
- "r_y1": 554.6666666666666,
- "r_x2": 299.0,
- "r_y2": 561.0,
- "r_x3": 326.33333333333337,
- "r_y3": 561.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "some",
- "orig": "some",
- "text_direction": "left_to_right",
- "confidence": 0.9569136,
- "from_ocr": true
- },
- {
- "index": 27,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 295.33333333333337,
- "r_y0": 554.6666666666666,
- "r_x1": 279.0,
- "r_y1": 554.6666666666666,
- "r_x2": 279.0,
- "r_y2": 563.3333333333334,
- "r_x3": 295.33333333333337,
- "r_y3": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "cell",
- "orig": "cell",
- "text_direction": "left_to_right",
- "confidence": 0.9622145799999999,
- "from_ocr": true
- },
- {
- "index": 28,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 213.66666666666666,
- "r_y0": 554.6666666666666,
- "r_x1": 190.0,
- "r_y1": 554.6666666666666,
- "r_x2": 190.0,
- "r_y2": 563.3333333333334,
- "r_x3": 213.66666666666666,
- "r_y3": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "have",
- "orig": "have",
- "text_direction": "left_to_right",
- "confidence": 0.96403,
- "from_ocr": true
- },
- {
- "index": 29,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 186.0,
- "r_y0": 554.6666666666666,
- "r_x1": 149.0,
- "r_y1": 554.6666666666666,
- "r_x2": 149.0,
- "r_y2": 563.0,
- "r_x3": 186.0,
- "r_y3": 563.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "content",
- "orig": "content",
- "text_direction": "left_to_right",
- "confidence": 0.96691612,
- "from_ocr": true
- },
- {
- "index": 30,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 451.6666666666667,
- "r_y0": 508.3333333333333,
- "r_x1": 422.6666666666667,
- "r_y1": 508.3333333333333,
- "r_x2": 422.6666666666667,
- "r_y2": 517.0,
- "r_x3": 451.6666666666667,
- "r_y3": 517.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "Some",
- "orig": "Some",
- "text_direction": "left_to_right",
- "confidence": 0.9684503200000001,
- "from_ocr": true
- },
- {
- "index": 31,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 419.0,
- "r_y0": 508.3333333333333,
- "r_x1": 393.0,
- "r_y1": 508.3333333333333,
- "r_x2": 393.0,
- "r_y2": 516.6666666666666,
- "r_x3": 419.0,
- "r_y3": 516.6666666666666,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.96073517,
- "from_ocr": true
- },
- {
- "index": 32,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 389.3333333333333,
- "r_y0": 508.3333333333333,
- "r_x1": 371.6666666666667,
- "r_y1": 508.3333333333333,
- "r_x2": 371.6666666666667,
- "r_y2": 514.6666666666666,
- "r_x3": 389.3333333333333,
- "r_y3": 514.6666666666666,
- "coord_origin": "TOPLEFT"
- },
- "text": "row",
- "orig": "row",
- "text_direction": "left_to_right",
- "confidence": 0.9615368700000001,
- "from_ocr": true
- },
- {
- "index": 33,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 329.0,
- "r_y0": 508.3333333333333,
- "r_x1": 303.0,
- "r_y1": 508.3333333333333,
- "r_x2": 303.0,
- "r_y2": 517.0,
- "r_x3": 329.0,
- "r_y3": 517.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.9626261100000001,
- "from_ocr": true
- },
- {
- "index": 34,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 299.66666666666663,
- "r_y0": 508.3333333333333,
- "r_x1": 275.66666666666663,
- "r_y1": 508.3333333333333,
- "r_x2": 275.66666666666663,
- "r_y2": 517.0,
- "r_x3": 299.66666666666663,
- "r_y3": 517.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "don't",
- "orig": "don't",
- "text_direction": "left_to_right",
- "confidence": 0.96669136,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": [
- {
- "id": 7,
- "label": "text",
- "bbox": {
- "l": 268.33333333333337,
- "t": 601.0,
- "r": 337.0,
- "b": 609.6666666666666,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.7441245913505554,
- "cells": [
- {
- "index": 19,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 337.0,
- "r_y0": 601.0,
- "r_x1": 308.0,
- "r_y1": 601.0,
- "r_x2": 308.0,
- "r_y2": 609.6666666666666,
- "r_x3": 337.0,
- "r_y3": 609.6666666666666,
- "coord_origin": "TOPLEFT"
- },
- "text": "Some",
- "orig": "Some",
- "text_direction": "left_to_right",
- "confidence": 0.95841644,
- "from_ocr": true
- },
- {
- "index": 20,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 304.0,
- "r_y0": 601.0,
- "r_x1": 268.33333333333337,
- "r_y1": 601.0,
- "r_x2": 268.33333333333337,
- "r_y2": 609.3333333333334,
- "r_x3": 304.0,
- "r_y3": 609.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "column",
- "orig": "column",
- "text_direction": "left_to_right",
- "confidence": 0.95624527,
- "from_ocr": true
- }
- ],
- "children": []
- },
{
"id": 1,
"label": "text",
"bbox": {
- "l": 133.0,
- "t": 601.0,
- "r": 230.66666666666666,
- "b": 609.6666666666666,
+ "l": 602.0,
+ "t": 485.66666666666663,
+ "r": 694.6666666666666,
+ "b": 506.3333333333333,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7668525576591492,
+ "confidence": 90.0,
"cells": [
{
- "index": 21,
+ "index": 0,
"rgba": {
"r": 0,
"g": 0,
@@ -1950,135 +905,20 @@
"a": 255
},
"rect": {
- "r_x0": 230.66666666666666,
- "r_y0": 601.0,
- "r_x1": 201.66666666666669,
- "r_y1": 601.0,
- "r_x2": 201.66666666666669,
- "r_y2": 609.6666666666666,
- "r_x3": 230.66666666666666,
- "r_y3": 609.6666666666666,
+ "r_x0": 694.6666666666666,
+ "r_y0": 485.66666666666663,
+ "r_x1": 602.0,
+ "r_y1": 485.66666666666663,
+ "r_x2": 602.0,
+ "r_y2": 506.3333333333333,
+ "r_x3": 694.6666666666666,
+ "r_y3": 506.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 0.96296555,
- "from_ocr": true
- },
- {
- "index": 22,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 197.66666666666669,
- "r_y0": 601.0,
- "r_x1": 172.0,
- "r_y1": 601.0,
- "r_x2": 172.0,
- "r_y2": 609.3333333333334,
- "r_x3": 197.66666666666669,
- "r_y3": 609.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.96467484,
- "from_ocr": true
- },
- {
- "index": 23,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 168.66666666666669,
- "r_y0": 601.0,
- "r_x1": 133.0,
- "r_y1": 601.0,
- "r_x2": 133.0,
- "r_y2": 609.3333333333334,
- "r_x3": 168.66666666666669,
- "r_y3": 609.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "column",
- "orig": "column",
- "text_direction": "left_to_right",
- "confidence": 0.95497986,
- "from_ocr": true
- }
- ],
- "children": []
- },
- {
- "id": 4,
- "label": "text",
- "bbox": {
- "l": 386.3333333333333,
- "t": 554.6666666666666,
- "r": 437.3333333333333,
- "b": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.7588309049606323,
- "cells": [
- {
- "index": 24,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 437.3333333333333,
- "r_y0": 554.6666666666666,
- "r_x1": 408.3333333333333,
- "r_y1": 554.6666666666666,
- "r_x2": 408.3333333333333,
- "r_y2": 563.3333333333334,
- "r_x3": 437.3333333333333,
- "r_y3": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "Some",
- "orig": "Some",
- "text_direction": "left_to_right",
- "confidence": 0.95944489,
- "from_ocr": true
- },
- {
- "index": 25,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 404.0,
- "r_y0": 554.6666666666666,
- "r_x1": 386.3333333333333,
- "r_y1": 554.6666666666666,
- "r_x2": 386.3333333333333,
- "r_y2": 561.0,
- "r_x3": 404.0,
- "r_y3": 561.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "row",
- "orig": "row",
- "text_direction": "left_to_right",
- "confidence": 0.9680950199999999,
+ "confidence": 90.0,
"from_ocr": true
}
],
@@ -2088,16 +928,16 @@
"id": 2,
"label": "text",
"bbox": {
- "l": 279.0,
- "t": 554.6666666666666,
- "r": 326.33333333333337,
- "b": 563.3333333333334,
+ "l": 610.0,
+ "t": 454.33333333333337,
+ "r": 680.0,
+ "b": 475.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7627862095832825,
+ "confidence": 90.0,
"cells": [
{
- "index": 26,
+ "index": 1,
"rgba": {
"r": 0,
"g": 0,
@@ -2105,110 +945,20 @@
"a": 255
},
"rect": {
- "r_x0": 326.33333333333337,
- "r_y0": 554.6666666666666,
- "r_x1": 299.0,
- "r_y1": 554.6666666666666,
- "r_x2": 299.0,
- "r_y2": 561.0,
- "r_x3": 326.33333333333337,
- "r_y3": 561.0,
+ "r_x0": 680.0,
+ "r_y0": 454.33333333333337,
+ "r_x1": 610.0,
+ "r_y1": 454.33333333333337,
+ "r_x2": 610.0,
+ "r_y2": 475.0,
+ "r_x3": 680.0,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "some",
- "orig": "some",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 0.9569136,
- "from_ocr": true
- },
- {
- "index": 27,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 295.33333333333337,
- "r_y0": 554.6666666666666,
- "r_x1": 279.0,
- "r_y1": 554.6666666666666,
- "r_x2": 279.0,
- "r_y2": 563.3333333333334,
- "r_x3": 295.33333333333337,
- "r_y3": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "cell",
- "orig": "cell",
- "text_direction": "left_to_right",
- "confidence": 0.9622145799999999,
- "from_ocr": true
- }
- ],
- "children": []
- },
- {
- "id": 5,
- "label": "text",
- "bbox": {
- "l": 149.0,
- "t": 554.6666666666666,
- "r": 213.66666666666666,
- "b": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.7541249394416809,
- "cells": [
- {
- "index": 28,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 213.66666666666666,
- "r_y0": 554.6666666666666,
- "r_x1": 190.0,
- "r_y1": 554.6666666666666,
- "r_x2": 190.0,
- "r_y2": 563.3333333333334,
- "r_x3": 213.66666666666666,
- "r_y3": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "have",
- "orig": "have",
- "text_direction": "left_to_right",
- "confidence": 0.96403,
- "from_ocr": true
- },
- {
- "index": 29,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 186.0,
- "r_y0": 554.6666666666666,
- "r_x1": 149.0,
- "r_y1": 554.6666666666666,
- "r_x2": 149.0,
- "r_y2": 563.0,
- "r_x3": 186.0,
- "r_y3": 563.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "content",
- "orig": "content",
- "text_direction": "left_to_right",
- "confidence": 0.96691612,
+ "confidence": 90.0,
"from_ocr": true
}
],
@@ -2218,16 +968,16 @@
"id": 3,
"label": "text",
"bbox": {
- "l": 371.6666666666667,
- "t": 508.3333333333333,
- "r": 451.6666666666667,
- "b": 517.0,
+ "l": 623.3333333333334,
+ "t": 392.0,
+ "r": 670.3333333333334,
+ "b": 408.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7616423964500427,
+ "confidence": 96.0,
"cells": [
{
- "index": 30,
+ "index": 2,
"rgba": {
"r": 0,
"g": 0,
@@ -2235,24 +985,39 @@
"a": 255
},
"rect": {
- "r_x0": 451.6666666666667,
- "r_y0": 508.3333333333333,
- "r_x1": 422.6666666666667,
- "r_y1": 508.3333333333333,
- "r_x2": 422.6666666666667,
- "r_y2": 517.0,
- "r_x3": 451.6666666666667,
- "r_y3": 517.0,
+ "r_x0": 670.3333333333334,
+ "r_y0": 392.0,
+ "r_x1": 623.3333333333334,
+ "r_y1": 392.0,
+ "r_x2": 623.3333333333334,
+ "r_y2": 408.0,
+ "r_x3": 670.3333333333334,
+ "r_y3": 408.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9684503200000001,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 4,
+ "label": "text",
+ "bbox": {
+ "l": 623.3333333333334,
+ "t": 312.0,
+ "r": 670.3333333333334,
+ "b": 328.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
{
- "index": 31,
+ "index": 3,
"rgba": {
"r": 0,
"g": 0,
@@ -2260,24 +1025,39 @@
"a": 255
},
"rect": {
- "r_x0": 419.0,
- "r_y0": 508.3333333333333,
- "r_x1": 393.0,
- "r_y1": 508.3333333333333,
- "r_x2": 393.0,
- "r_y2": 516.6666666666666,
- "r_x3": 419.0,
- "r_y3": 516.6666666666666,
+ "r_x0": 670.3333333333334,
+ "r_y0": 312.0,
+ "r_x1": 623.3333333333334,
+ "r_y1": 312.0,
+ "r_x2": 623.3333333333334,
+ "r_y2": 328.0,
+ "r_x3": 670.3333333333334,
+ "r_y3": 328.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96073517,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 5,
+ "label": "text",
+ "bbox": {
+ "l": 428.3333333333333,
+ "t": 485.66666666666663,
+ "r": 559.6666666666667,
+ "b": 506.3333333333333,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 92.0,
+ "cells": [
{
- "index": 32,
+ "index": 4,
"rgba": {
"r": 0,
"g": 0,
@@ -2285,20 +1065,20 @@
"a": 255
},
"rect": {
- "r_x0": 389.3333333333333,
- "r_y0": 508.3333333333333,
- "r_x1": 371.6666666666667,
- "r_y1": 508.3333333333333,
- "r_x2": 371.6666666666667,
- "r_y2": 514.6666666666666,
- "r_x3": 389.3333333333333,
- "r_y3": 514.6666666666666,
+ "r_x0": 559.6666666666667,
+ "r_y0": 485.66666666666663,
+ "r_x1": 428.3333333333333,
+ "r_y1": 485.66666666666663,
+ "r_x2": 428.3333333333333,
+ "r_y2": 506.3333333333333,
+ "r_x3": 559.6666666666667,
+ "r_y3": 506.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 0.9615368700000001,
+ "confidence": 92.0,
"from_ocr": true
}
],
@@ -2308,16 +1088,16 @@
"id": 6,
"label": "text",
"bbox": {
- "l": 275.66666666666663,
- "t": 508.3333333333333,
- "r": 329.0,
- "b": 517.0,
+ "l": 456.0,
+ "t": 459.0,
+ "r": 526.6666666666667,
+ "b": 475.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7468306422233582,
+ "confidence": 94.0,
"cells": [
{
- "index": 33,
+ "index": 5,
"rgba": {
"r": 0,
"g": 0,
@@ -2325,24 +1105,39 @@
"a": 255
},
"rect": {
- "r_x0": 329.0,
- "r_y0": 508.3333333333333,
- "r_x1": 303.0,
- "r_y1": 508.3333333333333,
- "r_x2": 303.0,
- "r_y2": 517.0,
- "r_x3": 329.0,
- "r_y3": 517.0,
+ "r_x0": 526.6666666666667,
+ "r_y0": 459.0,
+ "r_x1": 456.0,
+ "r_y1": 459.0,
+ "r_x2": 456.0,
+ "r_y2": 475.0,
+ "r_x3": 526.6666666666667,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9626261100000001,
+ "confidence": 94.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 7,
+ "label": "text",
+ "bbox": {
+ "l": 442.3333333333333,
+ "t": 408.0,
+ "r": 545.0,
+ "b": 424.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 91.0,
+ "cells": [
{
- "index": 34,
+ "index": 6,
"rgba": {
"r": 0,
"g": 0,
@@ -2350,20 +1145,380 @@
"a": 255
},
"rect": {
- "r_x0": 299.66666666666663,
- "r_y0": 508.3333333333333,
- "r_x1": 275.66666666666663,
- "r_y1": 508.3333333333333,
- "r_x2": 275.66666666666663,
- "r_y2": 517.0,
- "r_x3": 299.66666666666663,
- "r_y3": 517.0,
+ "r_x0": 545.0,
+ "r_y0": 408.0,
+ "r_x1": 442.3333333333333,
+ "r_y1": 408.0,
+ "r_x2": 442.3333333333333,
+ "r_y2": 424.0,
+ "r_x3": 545.0,
+ "r_y3": 424.0,
"coord_origin": "TOPLEFT"
},
- "text": "don't",
- "orig": "don't",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.96669136,
+ "confidence": 91.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 8,
+ "label": "text",
+ "bbox": {
+ "l": 468.0,
+ "t": 376.0,
+ "r": 515.0,
+ "b": 392.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
+ {
+ "index": 7,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 515.0,
+ "r_y0": 376.0,
+ "r_x1": 468.0,
+ "r_y1": 376.0,
+ "r_x2": 468.0,
+ "r_y2": 392.0,
+ "r_x3": 515.0,
+ "r_y3": 392.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 9,
+ "label": "text",
+ "bbox": {
+ "l": 442.3333333333333,
+ "t": 328.0,
+ "r": 545.0,
+ "b": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
+ {
+ "index": 8,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 545.0,
+ "r_y0": 328.0,
+ "r_x1": 442.3333333333333,
+ "r_y1": 328.0,
+ "r_x2": 442.3333333333333,
+ "r_y2": 344.0,
+ "r_x3": 545.0,
+ "r_y3": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Some other",
+ "orig": "Some other",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 10,
+ "label": "text",
+ "bbox": {
+ "l": 468.0,
+ "t": 296.6666666666667,
+ "r": 515.0,
+ "b": 312.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 9,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 515.0,
+ "r_y0": 296.6666666666667,
+ "r_x1": 468.0,
+ "r_y1": 296.6666666666667,
+ "r_x2": 468.0,
+ "r_y2": 312.6666666666667,
+ "r_x3": 515.0,
+ "r_y3": 312.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 11,
+ "label": "text",
+ "bbox": {
+ "l": 274.0,
+ "t": 490.33333333333337,
+ "r": 385.6666666666667,
+ "b": 506.3333333333333,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 10,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 385.6666666666667,
+ "r_y0": 490.33333333333337,
+ "r_x1": 274.0,
+ "r_y1": 490.33333333333337,
+ "r_x2": 274.0,
+ "r_y2": 506.3333333333333,
+ "r_x3": 385.6666666666667,
+ "r_y3": 506.3333333333333,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 12,
+ "label": "text",
+ "bbox": {
+ "l": 292.66666666666663,
+ "t": 459.0,
+ "r": 363.0,
+ "b": 475.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
+ {
+ "index": 11,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 363.0,
+ "r_y0": 459.0,
+ "r_x1": 292.66666666666663,
+ "r_y1": 459.0,
+ "r_x2": 292.66666666666663,
+ "r_y2": 475.0,
+ "r_x3": 363.0,
+ "r_y3": 475.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "column",
+ "orig": "column",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 13,
+ "label": "text",
+ "bbox": {
+ "l": 278.0,
+ "t": 408.0,
+ "r": 383.6666666666667,
+ "b": 424.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
+ {
+ "index": 12,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 383.6666666666667,
+ "r_y0": 408.0,
+ "r_x1": 278.0,
+ "r_y1": 408.0,
+ "r_x2": 278.0,
+ "r_y2": 424.0,
+ "r_x3": 383.6666666666667,
+ "r_y3": 424.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 14,
+ "label": "text",
+ "bbox": {
+ "l": 304.33333333333337,
+ "t": 376.0,
+ "r": 351.33333333333337,
+ "b": 392.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 351.33333333333337,
+ "r_y0": 376.0,
+ "r_x1": 304.33333333333337,
+ "r_y1": 376.0,
+ "r_x2": 304.33333333333337,
+ "r_y2": 392.0,
+ "r_x3": 351.33333333333337,
+ "r_y3": 392.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 15,
+ "label": "text",
+ "bbox": {
+ "l": 278.0,
+ "t": 328.0,
+ "r": 383.6666666666667,
+ "b": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 383.6666666666667,
+ "r_y0": 328.0,
+ "r_x1": 278.0,
+ "r_y1": 328.0,
+ "r_x2": 278.0,
+ "r_y2": 344.0,
+ "r_x3": 383.6666666666667,
+ "r_y3": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 16,
+ "label": "text",
+ "bbox": {
+ "l": 304.33333333333337,
+ "t": 296.6666666666667,
+ "r": 351.33333333333337,
+ "b": 312.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 351.33333333333337,
+ "r_y0": 296.6666666666667,
+ "r_x1": 304.33333333333337,
+ "r_y1": 296.6666666666667,
+ "r_x2": 304.33333333333337,
+ "r_y2": 312.6666666666667,
+ "r_x3": 351.33333333333337,
+ "r_y3": 312.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
"from_ocr": true
}
],
@@ -2375,24 +1530,24 @@
},
"tablestructure": {
"table_map": {
- "9": {
+ "0": {
"label": "table",
- "id": 9,
+ "id": 0,
"page_no": 0,
"cluster": {
- "id": 9,
+ "id": 0,
"label": "table",
"bbox": {
- "l": 112.69406127929688,
- "t": 489.72344970703125,
- "r": 470.0718078613281,
- "b": 628.2994995117188,
+ "l": 240.90093994140625,
+ "t": 277.41973876953125,
+ "r": 722.950309753418,
+ "b": 524.3504486083984,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.6408323049545288,
+ "confidence": 0.9790865778923035,
"cells": [
{
- "index": 19,
+ "index": 0,
"rgba": {
"r": 0,
"g": 0,
@@ -2400,24 +1555,24 @@
"a": 255
},
"rect": {
- "r_x0": 337.0,
- "r_y0": 601.0,
- "r_x1": 308.0,
- "r_y1": 601.0,
- "r_x2": 308.0,
- "r_y2": 609.6666666666666,
- "r_x3": 337.0,
- "r_y3": 609.6666666666666,
+ "r_x0": 694.6666666666666,
+ "r_y0": 485.66666666666663,
+ "r_x1": 602.0,
+ "r_y1": 485.66666666666663,
+ "r_x2": 602.0,
+ "r_y2": 506.3333333333333,
+ "r_x3": 694.6666666666666,
+ "r_y3": 506.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 0.95841644,
+ "confidence": 90.0,
"from_ocr": true
},
{
- "index": 20,
+ "index": 1,
"rgba": {
"r": 0,
"g": 0,
@@ -2425,24 +1580,124 @@
"a": 255
},
"rect": {
- "r_x0": 304.0,
- "r_y0": 601.0,
- "r_x1": 268.33333333333337,
- "r_y1": 601.0,
- "r_x2": 268.33333333333337,
- "r_y2": 609.3333333333334,
- "r_x3": 304.0,
- "r_y3": 609.3333333333334,
+ "r_x0": 680.0,
+ "r_y0": 454.33333333333337,
+ "r_x1": 610.0,
+ "r_y1": 454.33333333333337,
+ "r_x2": 610.0,
+ "r_y2": 475.0,
+ "r_x3": 680.0,
+ "r_y3": 475.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "merged",
+ "orig": "merged",
+ "text_direction": "left_to_right",
+ "confidence": 90.0,
+ "from_ocr": true
+ },
+ {
+ "index": 2,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 670.3333333333334,
+ "r_y0": 392.0,
+ "r_x1": 623.3333333333334,
+ "r_y1": 392.0,
+ "r_x2": 623.3333333333334,
+ "r_y2": 408.0,
+ "r_x3": 670.3333333333334,
+ "r_y3": 408.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ },
+ {
+ "index": 3,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 670.3333333333334,
+ "r_y0": 312.0,
+ "r_x1": 623.3333333333334,
+ "r_y1": 312.0,
+ "r_x2": 623.3333333333334,
+ "r_y2": 328.0,
+ "r_x3": 670.3333333333334,
+ "r_y3": 328.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ },
+ {
+ "index": 4,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 559.6666666666667,
+ "r_y0": 485.66666666666663,
+ "r_x1": 428.3333333333333,
+ "r_y1": 485.66666666666663,
+ "r_x2": 428.3333333333333,
+ "r_y2": 506.3333333333333,
+ "r_x3": 559.6666666666667,
+ "r_y3": 506.3333333333333,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Other merged",
+ "orig": "Other merged",
+ "text_direction": "left_to_right",
+ "confidence": 92.0,
+ "from_ocr": true
+ },
+ {
+ "index": 5,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 526.6666666666667,
+ "r_y0": 459.0,
+ "r_x1": 456.0,
+ "r_y1": 459.0,
+ "r_x2": 456.0,
+ "r_y2": 475.0,
+ "r_x3": 526.6666666666667,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
"text": "column",
"orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.95624527,
+ "confidence": 94.0,
"from_ocr": true
},
{
- "index": 21,
+ "index": 6,
"rgba": {
"r": 0,
"g": 0,
@@ -2450,24 +1705,24 @@
"a": 255
},
"rect": {
- "r_x0": 230.66666666666666,
- "r_y0": 601.0,
- "r_x1": 201.66666666666669,
- "r_y1": 601.0,
- "r_x2": 201.66666666666669,
- "r_y2": 609.6666666666666,
- "r_x3": 230.66666666666666,
- "r_y3": 609.6666666666666,
+ "r_x0": 545.0,
+ "r_y0": 408.0,
+ "r_x1": 442.3333333333333,
+ "r_y1": 408.0,
+ "r_x2": 442.3333333333333,
+ "r_y2": 424.0,
+ "r_x3": 545.0,
+ "r_y3": 424.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.96296555,
+ "confidence": 91.0,
"from_ocr": true
},
{
- "index": 22,
+ "index": 7,
"rgba": {
"r": 0,
"g": 0,
@@ -2475,24 +1730,24 @@
"a": 255
},
"rect": {
- "r_x0": 197.66666666666669,
- "r_y0": 601.0,
- "r_x1": 172.0,
- "r_y1": 601.0,
- "r_x2": 172.0,
- "r_y2": 609.3333333333334,
- "r_x3": 197.66666666666669,
- "r_y3": 609.3333333333334,
+ "r_x0": 515.0,
+ "r_y0": 376.0,
+ "r_x1": 468.0,
+ "r_y1": 376.0,
+ "r_x2": 468.0,
+ "r_y2": 392.0,
+ "r_x3": 515.0,
+ "r_y3": 392.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96467484,
+ "confidence": 96.0,
"from_ocr": true
},
{
- "index": 23,
+ "index": 8,
"rgba": {
"r": 0,
"g": 0,
@@ -2500,24 +1755,99 @@
"a": 255
},
"rect": {
- "r_x0": 168.66666666666669,
- "r_y0": 601.0,
- "r_x1": 133.0,
- "r_y1": 601.0,
- "r_x2": 133.0,
- "r_y2": 609.3333333333334,
- "r_x3": 168.66666666666669,
- "r_y3": 609.3333333333334,
+ "r_x0": 545.0,
+ "r_y0": 328.0,
+ "r_x1": 442.3333333333333,
+ "r_y1": 328.0,
+ "r_x2": 442.3333333333333,
+ "r_y2": 344.0,
+ "r_x3": 545.0,
+ "r_y3": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Some other",
+ "orig": "Some other",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ },
+ {
+ "index": 9,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 515.0,
+ "r_y0": 296.6666666666667,
+ "r_x1": 468.0,
+ "r_y1": 296.6666666666667,
+ "r_x2": 468.0,
+ "r_y2": 312.6666666666667,
+ "r_x3": 515.0,
+ "r_y3": 312.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 10,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 385.6666666666667,
+ "r_y0": 490.33333333333337,
+ "r_x1": 274.0,
+ "r_y1": 490.33333333333337,
+ "r_x2": 274.0,
+ "r_y2": 506.3333333333333,
+ "r_x3": 385.6666666666667,
+ "r_y3": 506.3333333333333,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 11,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 363.0,
+ "r_y0": 459.0,
+ "r_x1": 292.66666666666663,
+ "r_y1": 459.0,
+ "r_x2": 292.66666666666663,
+ "r_y2": 475.0,
+ "r_x3": 363.0,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
"text": "column",
"orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.95497986,
+ "confidence": 94.0,
"from_ocr": true
},
{
- "index": 24,
+ "index": 12,
"rgba": {
"r": 0,
"g": 0,
@@ -2525,24 +1855,24 @@
"a": 255
},
"rect": {
- "r_x0": 437.3333333333333,
- "r_y0": 554.6666666666666,
- "r_x1": 408.3333333333333,
- "r_y1": 554.6666666666666,
- "r_x2": 408.3333333333333,
- "r_y2": 563.3333333333334,
- "r_x3": 437.3333333333333,
- "r_y3": 563.3333333333334,
+ "r_x0": 383.6666666666667,
+ "r_y0": 408.0,
+ "r_x1": 278.0,
+ "r_y1": 408.0,
+ "r_x2": 278.0,
+ "r_y2": 424.0,
+ "r_x3": 383.6666666666667,
+ "r_y3": 424.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.95944489,
+ "confidence": 94.0,
"from_ocr": true
},
{
- "index": 25,
+ "index": 13,
"rgba": {
"r": 0,
"g": 0,
@@ -2550,24 +1880,24 @@
"a": 255
},
"rect": {
- "r_x0": 404.0,
- "r_y0": 554.6666666666666,
- "r_x1": 386.3333333333333,
- "r_y1": 554.6666666666666,
- "r_x2": 386.3333333333333,
- "r_y2": 561.0,
- "r_x3": 404.0,
- "r_y3": 561.0,
+ "r_x0": 351.33333333333337,
+ "r_y0": 376.0,
+ "r_x1": 304.33333333333337,
+ "r_y1": 376.0,
+ "r_x2": 304.33333333333337,
+ "r_y2": 392.0,
+ "r_x3": 351.33333333333337,
+ "r_y3": 392.0,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9680950199999999,
+ "confidence": 96.0,
"from_ocr": true
},
{
- "index": 26,
+ "index": 14,
"rgba": {
"r": 0,
"g": 0,
@@ -2575,24 +1905,24 @@
"a": 255
},
"rect": {
- "r_x0": 326.33333333333337,
- "r_y0": 554.6666666666666,
- "r_x1": 299.0,
- "r_y1": 554.6666666666666,
- "r_x2": 299.0,
- "r_y2": 561.0,
- "r_x3": 326.33333333333337,
- "r_y3": 561.0,
+ "r_x0": 383.6666666666667,
+ "r_y0": 328.0,
+ "r_x1": 278.0,
+ "r_y1": 328.0,
+ "r_x2": 278.0,
+ "r_y2": 344.0,
+ "r_x3": 383.6666666666667,
+ "r_y3": 344.0,
"coord_origin": "TOPLEFT"
},
- "text": "some",
- "orig": "some",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.9569136,
+ "confidence": 94.0,
"from_ocr": true
},
{
- "index": 27,
+ "index": 15,
"rgba": {
"r": 0,
"g": 0,
@@ -2600,278 +1930,38 @@
"a": 255
},
"rect": {
- "r_x0": 295.33333333333337,
- "r_y0": 554.6666666666666,
- "r_x1": 279.0,
- "r_y1": 554.6666666666666,
- "r_x2": 279.0,
- "r_y2": 563.3333333333334,
- "r_x3": 295.33333333333337,
- "r_y3": 563.3333333333334,
+ "r_x0": 351.33333333333337,
+ "r_y0": 296.6666666666667,
+ "r_x1": 304.33333333333337,
+ "r_y1": 296.6666666666667,
+ "r_x2": 304.33333333333337,
+ "r_y2": 312.6666666666667,
+ "r_x3": 351.33333333333337,
+ "r_y3": 312.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "cell",
- "orig": "cell",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9622145799999999,
- "from_ocr": true
- },
- {
- "index": 28,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 213.66666666666666,
- "r_y0": 554.6666666666666,
- "r_x1": 190.0,
- "r_y1": 554.6666666666666,
- "r_x2": 190.0,
- "r_y2": 563.3333333333334,
- "r_x3": 213.66666666666666,
- "r_y3": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "have",
- "orig": "have",
- "text_direction": "left_to_right",
- "confidence": 0.96403,
- "from_ocr": true
- },
- {
- "index": 29,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 186.0,
- "r_y0": 554.6666666666666,
- "r_x1": 149.0,
- "r_y1": 554.6666666666666,
- "r_x2": 149.0,
- "r_y2": 563.0,
- "r_x3": 186.0,
- "r_y3": 563.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "content",
- "orig": "content",
- "text_direction": "left_to_right",
- "confidence": 0.96691612,
- "from_ocr": true
- },
- {
- "index": 30,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 451.6666666666667,
- "r_y0": 508.3333333333333,
- "r_x1": 422.6666666666667,
- "r_y1": 508.3333333333333,
- "r_x2": 422.6666666666667,
- "r_y2": 517.0,
- "r_x3": 451.6666666666667,
- "r_y3": 517.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "Some",
- "orig": "Some",
- "text_direction": "left_to_right",
- "confidence": 0.9684503200000001,
- "from_ocr": true
- },
- {
- "index": 31,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 419.0,
- "r_y0": 508.3333333333333,
- "r_x1": 393.0,
- "r_y1": 508.3333333333333,
- "r_x2": 393.0,
- "r_y2": 516.6666666666666,
- "r_x3": 419.0,
- "r_y3": 516.6666666666666,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.96073517,
- "from_ocr": true
- },
- {
- "index": 32,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 389.3333333333333,
- "r_y0": 508.3333333333333,
- "r_x1": 371.6666666666667,
- "r_y1": 508.3333333333333,
- "r_x2": 371.6666666666667,
- "r_y2": 514.6666666666666,
- "r_x3": 389.3333333333333,
- "r_y3": 514.6666666666666,
- "coord_origin": "TOPLEFT"
- },
- "text": "row",
- "orig": "row",
- "text_direction": "left_to_right",
- "confidence": 0.9615368700000001,
- "from_ocr": true
- },
- {
- "index": 33,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 329.0,
- "r_y0": 508.3333333333333,
- "r_x1": 303.0,
- "r_y1": 508.3333333333333,
- "r_x2": 303.0,
- "r_y2": 517.0,
- "r_x3": 329.0,
- "r_y3": 517.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.9626261100000001,
- "from_ocr": true
- },
- {
- "index": 34,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 299.66666666666663,
- "r_y0": 508.3333333333333,
- "r_x1": 275.66666666666663,
- "r_y1": 508.3333333333333,
- "r_x2": 275.66666666666663,
- "r_y2": 517.0,
- "r_x3": 299.66666666666663,
- "r_y3": 517.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "don't",
- "orig": "don't",
- "text_direction": "left_to_right",
- "confidence": 0.96669136,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": [
- {
- "id": 7,
- "label": "text",
- "bbox": {
- "l": 268.33333333333337,
- "t": 601.0,
- "r": 337.0,
- "b": 609.6666666666666,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.7441245913505554,
- "cells": [
- {
- "index": 19,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 337.0,
- "r_y0": 601.0,
- "r_x1": 308.0,
- "r_y1": 601.0,
- "r_x2": 308.0,
- "r_y2": 609.6666666666666,
- "r_x3": 337.0,
- "r_y3": 609.6666666666666,
- "coord_origin": "TOPLEFT"
- },
- "text": "Some",
- "orig": "Some",
- "text_direction": "left_to_right",
- "confidence": 0.95841644,
- "from_ocr": true
- },
- {
- "index": 20,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 304.0,
- "r_y0": 601.0,
- "r_x1": 268.33333333333337,
- "r_y1": 601.0,
- "r_x2": 268.33333333333337,
- "r_y2": 609.3333333333334,
- "r_x3": 304.0,
- "r_y3": 609.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "column",
- "orig": "column",
- "text_direction": "left_to_right",
- "confidence": 0.95624527,
- "from_ocr": true
- }
- ],
- "children": []
- },
{
"id": 1,
"label": "text",
"bbox": {
- "l": 133.0,
- "t": 601.0,
- "r": 230.66666666666666,
- "b": 609.6666666666666,
+ "l": 602.0,
+ "t": 485.66666666666663,
+ "r": 694.6666666666666,
+ "b": 506.3333333333333,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7668525576591492,
+ "confidence": 90.0,
"cells": [
{
- "index": 21,
+ "index": 0,
"rgba": {
"r": 0,
"g": 0,
@@ -2879,135 +1969,20 @@
"a": 255
},
"rect": {
- "r_x0": 230.66666666666666,
- "r_y0": 601.0,
- "r_x1": 201.66666666666669,
- "r_y1": 601.0,
- "r_x2": 201.66666666666669,
- "r_y2": 609.6666666666666,
- "r_x3": 230.66666666666666,
- "r_y3": 609.6666666666666,
+ "r_x0": 694.6666666666666,
+ "r_y0": 485.66666666666663,
+ "r_x1": 602.0,
+ "r_y1": 485.66666666666663,
+ "r_x2": 602.0,
+ "r_y2": 506.3333333333333,
+ "r_x3": 694.6666666666666,
+ "r_y3": 506.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 0.96296555,
- "from_ocr": true
- },
- {
- "index": 22,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 197.66666666666669,
- "r_y0": 601.0,
- "r_x1": 172.0,
- "r_y1": 601.0,
- "r_x2": 172.0,
- "r_y2": 609.3333333333334,
- "r_x3": 197.66666666666669,
- "r_y3": 609.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.96467484,
- "from_ocr": true
- },
- {
- "index": 23,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 168.66666666666669,
- "r_y0": 601.0,
- "r_x1": 133.0,
- "r_y1": 601.0,
- "r_x2": 133.0,
- "r_y2": 609.3333333333334,
- "r_x3": 168.66666666666669,
- "r_y3": 609.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "column",
- "orig": "column",
- "text_direction": "left_to_right",
- "confidence": 0.95497986,
- "from_ocr": true
- }
- ],
- "children": []
- },
- {
- "id": 4,
- "label": "text",
- "bbox": {
- "l": 386.3333333333333,
- "t": 554.6666666666666,
- "r": 437.3333333333333,
- "b": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.7588309049606323,
- "cells": [
- {
- "index": 24,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 437.3333333333333,
- "r_y0": 554.6666666666666,
- "r_x1": 408.3333333333333,
- "r_y1": 554.6666666666666,
- "r_x2": 408.3333333333333,
- "r_y2": 563.3333333333334,
- "r_x3": 437.3333333333333,
- "r_y3": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "Some",
- "orig": "Some",
- "text_direction": "left_to_right",
- "confidence": 0.95944489,
- "from_ocr": true
- },
- {
- "index": 25,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 404.0,
- "r_y0": 554.6666666666666,
- "r_x1": 386.3333333333333,
- "r_y1": 554.6666666666666,
- "r_x2": 386.3333333333333,
- "r_y2": 561.0,
- "r_x3": 404.0,
- "r_y3": 561.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "row",
- "orig": "row",
- "text_direction": "left_to_right",
- "confidence": 0.9680950199999999,
+ "confidence": 90.0,
"from_ocr": true
}
],
@@ -3017,16 +1992,16 @@
"id": 2,
"label": "text",
"bbox": {
- "l": 279.0,
- "t": 554.6666666666666,
- "r": 326.33333333333337,
- "b": 563.3333333333334,
+ "l": 610.0,
+ "t": 454.33333333333337,
+ "r": 680.0,
+ "b": 475.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7627862095832825,
+ "confidence": 90.0,
"cells": [
{
- "index": 26,
+ "index": 1,
"rgba": {
"r": 0,
"g": 0,
@@ -3034,110 +2009,20 @@
"a": 255
},
"rect": {
- "r_x0": 326.33333333333337,
- "r_y0": 554.6666666666666,
- "r_x1": 299.0,
- "r_y1": 554.6666666666666,
- "r_x2": 299.0,
- "r_y2": 561.0,
- "r_x3": 326.33333333333337,
- "r_y3": 561.0,
+ "r_x0": 680.0,
+ "r_y0": 454.33333333333337,
+ "r_x1": 610.0,
+ "r_y1": 454.33333333333337,
+ "r_x2": 610.0,
+ "r_y2": 475.0,
+ "r_x3": 680.0,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "some",
- "orig": "some",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 0.9569136,
- "from_ocr": true
- },
- {
- "index": 27,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 295.33333333333337,
- "r_y0": 554.6666666666666,
- "r_x1": 279.0,
- "r_y1": 554.6666666666666,
- "r_x2": 279.0,
- "r_y2": 563.3333333333334,
- "r_x3": 295.33333333333337,
- "r_y3": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "cell",
- "orig": "cell",
- "text_direction": "left_to_right",
- "confidence": 0.9622145799999999,
- "from_ocr": true
- }
- ],
- "children": []
- },
- {
- "id": 5,
- "label": "text",
- "bbox": {
- "l": 149.0,
- "t": 554.6666666666666,
- "r": 213.66666666666666,
- "b": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.7541249394416809,
- "cells": [
- {
- "index": 28,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 213.66666666666666,
- "r_y0": 554.6666666666666,
- "r_x1": 190.0,
- "r_y1": 554.6666666666666,
- "r_x2": 190.0,
- "r_y2": 563.3333333333334,
- "r_x3": 213.66666666666666,
- "r_y3": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "have",
- "orig": "have",
- "text_direction": "left_to_right",
- "confidence": 0.96403,
- "from_ocr": true
- },
- {
- "index": 29,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 186.0,
- "r_y0": 554.6666666666666,
- "r_x1": 149.0,
- "r_y1": 554.6666666666666,
- "r_x2": 149.0,
- "r_y2": 563.0,
- "r_x3": 186.0,
- "r_y3": 563.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "content",
- "orig": "content",
- "text_direction": "left_to_right",
- "confidence": 0.96691612,
+ "confidence": 90.0,
"from_ocr": true
}
],
@@ -3147,16 +2032,16 @@
"id": 3,
"label": "text",
"bbox": {
- "l": 371.6666666666667,
- "t": 508.3333333333333,
- "r": 451.6666666666667,
- "b": 517.0,
+ "l": 623.3333333333334,
+ "t": 392.0,
+ "r": 670.3333333333334,
+ "b": 408.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7616423964500427,
+ "confidence": 96.0,
"cells": [
{
- "index": 30,
+ "index": 2,
"rgba": {
"r": 0,
"g": 0,
@@ -3164,24 +2049,39 @@
"a": 255
},
"rect": {
- "r_x0": 451.6666666666667,
- "r_y0": 508.3333333333333,
- "r_x1": 422.6666666666667,
- "r_y1": 508.3333333333333,
- "r_x2": 422.6666666666667,
- "r_y2": 517.0,
- "r_x3": 451.6666666666667,
- "r_y3": 517.0,
+ "r_x0": 670.3333333333334,
+ "r_y0": 392.0,
+ "r_x1": 623.3333333333334,
+ "r_y1": 392.0,
+ "r_x2": 623.3333333333334,
+ "r_y2": 408.0,
+ "r_x3": 670.3333333333334,
+ "r_y3": 408.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9684503200000001,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 4,
+ "label": "text",
+ "bbox": {
+ "l": 623.3333333333334,
+ "t": 312.0,
+ "r": 670.3333333333334,
+ "b": 328.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
{
- "index": 31,
+ "index": 3,
"rgba": {
"r": 0,
"g": 0,
@@ -3189,24 +2089,39 @@
"a": 255
},
"rect": {
- "r_x0": 419.0,
- "r_y0": 508.3333333333333,
- "r_x1": 393.0,
- "r_y1": 508.3333333333333,
- "r_x2": 393.0,
- "r_y2": 516.6666666666666,
- "r_x3": 419.0,
- "r_y3": 516.6666666666666,
+ "r_x0": 670.3333333333334,
+ "r_y0": 312.0,
+ "r_x1": 623.3333333333334,
+ "r_y1": 312.0,
+ "r_x2": 623.3333333333334,
+ "r_y2": 328.0,
+ "r_x3": 670.3333333333334,
+ "r_y3": 328.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96073517,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 5,
+ "label": "text",
+ "bbox": {
+ "l": 428.3333333333333,
+ "t": 485.66666666666663,
+ "r": 559.6666666666667,
+ "b": 506.3333333333333,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 92.0,
+ "cells": [
{
- "index": 32,
+ "index": 4,
"rgba": {
"r": 0,
"g": 0,
@@ -3214,20 +2129,20 @@
"a": 255
},
"rect": {
- "r_x0": 389.3333333333333,
- "r_y0": 508.3333333333333,
- "r_x1": 371.6666666666667,
- "r_y1": 508.3333333333333,
- "r_x2": 371.6666666666667,
- "r_y2": 514.6666666666666,
- "r_x3": 389.3333333333333,
- "r_y3": 514.6666666666666,
+ "r_x0": 559.6666666666667,
+ "r_y0": 485.66666666666663,
+ "r_x1": 428.3333333333333,
+ "r_y1": 485.66666666666663,
+ "r_x2": 428.3333333333333,
+ "r_y2": 506.3333333333333,
+ "r_x3": 559.6666666666667,
+ "r_y3": 506.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 0.9615368700000001,
+ "confidence": 92.0,
"from_ocr": true
}
],
@@ -3237,16 +2152,16 @@
"id": 6,
"label": "text",
"bbox": {
- "l": 275.66666666666663,
- "t": 508.3333333333333,
- "r": 329.0,
- "b": 517.0,
+ "l": 456.0,
+ "t": 459.0,
+ "r": 526.6666666666667,
+ "b": 475.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7468306422233582,
+ "confidence": 94.0,
"cells": [
{
- "index": 33,
+ "index": 5,
"rgba": {
"r": 0,
"g": 0,
@@ -3254,24 +2169,39 @@
"a": 255
},
"rect": {
- "r_x0": 329.0,
- "r_y0": 508.3333333333333,
- "r_x1": 303.0,
- "r_y1": 508.3333333333333,
- "r_x2": 303.0,
- "r_y2": 517.0,
- "r_x3": 329.0,
- "r_y3": 517.0,
+ "r_x0": 526.6666666666667,
+ "r_y0": 459.0,
+ "r_x1": 456.0,
+ "r_y1": 459.0,
+ "r_x2": 456.0,
+ "r_y2": 475.0,
+ "r_x3": 526.6666666666667,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9626261100000001,
+ "confidence": 94.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 7,
+ "label": "text",
+ "bbox": {
+ "l": 442.3333333333333,
+ "t": 408.0,
+ "r": 545.0,
+ "b": 424.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 91.0,
+ "cells": [
{
- "index": 34,
+ "index": 6,
"rgba": {
"r": 0,
"g": 0,
@@ -3279,20 +2209,380 @@
"a": 255
},
"rect": {
- "r_x0": 299.66666666666663,
- "r_y0": 508.3333333333333,
- "r_x1": 275.66666666666663,
- "r_y1": 508.3333333333333,
- "r_x2": 275.66666666666663,
- "r_y2": 517.0,
- "r_x3": 299.66666666666663,
- "r_y3": 517.0,
+ "r_x0": 545.0,
+ "r_y0": 408.0,
+ "r_x1": 442.3333333333333,
+ "r_y1": 408.0,
+ "r_x2": 442.3333333333333,
+ "r_y2": 424.0,
+ "r_x3": 545.0,
+ "r_y3": 424.0,
"coord_origin": "TOPLEFT"
},
- "text": "don't",
- "orig": "don't",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.96669136,
+ "confidence": 91.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 8,
+ "label": "text",
+ "bbox": {
+ "l": 468.0,
+ "t": 376.0,
+ "r": 515.0,
+ "b": 392.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
+ {
+ "index": 7,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 515.0,
+ "r_y0": 376.0,
+ "r_x1": 468.0,
+ "r_y1": 376.0,
+ "r_x2": 468.0,
+ "r_y2": 392.0,
+ "r_x3": 515.0,
+ "r_y3": 392.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 9,
+ "label": "text",
+ "bbox": {
+ "l": 442.3333333333333,
+ "t": 328.0,
+ "r": 545.0,
+ "b": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
+ {
+ "index": 8,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 545.0,
+ "r_y0": 328.0,
+ "r_x1": 442.3333333333333,
+ "r_y1": 328.0,
+ "r_x2": 442.3333333333333,
+ "r_y2": 344.0,
+ "r_x3": 545.0,
+ "r_y3": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Some other",
+ "orig": "Some other",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 10,
+ "label": "text",
+ "bbox": {
+ "l": 468.0,
+ "t": 296.6666666666667,
+ "r": 515.0,
+ "b": 312.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 9,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 515.0,
+ "r_y0": 296.6666666666667,
+ "r_x1": 468.0,
+ "r_y1": 296.6666666666667,
+ "r_x2": 468.0,
+ "r_y2": 312.6666666666667,
+ "r_x3": 515.0,
+ "r_y3": 312.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 11,
+ "label": "text",
+ "bbox": {
+ "l": 274.0,
+ "t": 490.33333333333337,
+ "r": 385.6666666666667,
+ "b": 506.3333333333333,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 10,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 385.6666666666667,
+ "r_y0": 490.33333333333337,
+ "r_x1": 274.0,
+ "r_y1": 490.33333333333337,
+ "r_x2": 274.0,
+ "r_y2": 506.3333333333333,
+ "r_x3": 385.6666666666667,
+ "r_y3": 506.3333333333333,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 12,
+ "label": "text",
+ "bbox": {
+ "l": 292.66666666666663,
+ "t": 459.0,
+ "r": 363.0,
+ "b": 475.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
+ {
+ "index": 11,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 363.0,
+ "r_y0": 459.0,
+ "r_x1": 292.66666666666663,
+ "r_y1": 459.0,
+ "r_x2": 292.66666666666663,
+ "r_y2": 475.0,
+ "r_x3": 363.0,
+ "r_y3": 475.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "column",
+ "orig": "column",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 13,
+ "label": "text",
+ "bbox": {
+ "l": 278.0,
+ "t": 408.0,
+ "r": 383.6666666666667,
+ "b": 424.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
+ {
+ "index": 12,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 383.6666666666667,
+ "r_y0": 408.0,
+ "r_x1": 278.0,
+ "r_y1": 408.0,
+ "r_x2": 278.0,
+ "r_y2": 424.0,
+ "r_x3": 383.6666666666667,
+ "r_y3": 424.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 14,
+ "label": "text",
+ "bbox": {
+ "l": 304.33333333333337,
+ "t": 376.0,
+ "r": 351.33333333333337,
+ "b": 392.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 351.33333333333337,
+ "r_y0": 376.0,
+ "r_x1": 304.33333333333337,
+ "r_y1": 376.0,
+ "r_x2": 304.33333333333337,
+ "r_y2": 392.0,
+ "r_x3": 351.33333333333337,
+ "r_y3": 392.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 15,
+ "label": "text",
+ "bbox": {
+ "l": 278.0,
+ "t": 328.0,
+ "r": 383.6666666666667,
+ "b": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 383.6666666666667,
+ "r_y0": 328.0,
+ "r_x1": 278.0,
+ "r_y1": 328.0,
+ "r_x2": 278.0,
+ "r_y2": 344.0,
+ "r_x3": 383.6666666666667,
+ "r_y3": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 16,
+ "label": "text",
+ "bbox": {
+ "l": 304.33333333333337,
+ "t": 296.6666666666667,
+ "r": 351.33333333333337,
+ "b": 312.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 351.33333333333337,
+ "r_y0": 296.6666666666667,
+ "r_x1": 304.33333333333337,
+ "r_y1": 296.6666666666667,
+ "r_x2": 304.33333333333337,
+ "r_y2": 312.6666666666667,
+ "r_x3": 351.33333333333337,
+ "r_y3": 312.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
"from_ocr": true
}
],
@@ -3302,17 +2592,17 @@
},
"text": null,
"otsl_seq": [
- "ecel",
+ "ched",
"ched",
"ched",
"nl",
- "rhed",
+ "fcel",
"fcel",
"fcel",
"nl",
- "rhed",
"fcel",
- "ecel",
+ "fcel",
+ "fcel",
"nl"
],
"num_rows": 3,
@@ -3320,29 +2610,48 @@
"table_cells": [
{
"bbox": {
- "l": 308.0,
- "t": 601.0,
- "r": 337.0,
- "b": 609.6666666666666,
+ "l": 97.33333333333337,
+ "t": 105.66666666666669,
+ "r": 190.0,
+ "b": 126.33333333333337,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
"col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "Some column",
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 0,
+ "end_col_offset_idx": 1,
+ "text": "Vertically merged",
+ "column_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 121.66666666666663,
+ "t": 204.0,
+ "r": 168.66666666666663,
+ "b": 220.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 0,
+ "end_col_offset_idx": 1,
+ "text": "value",
"column_header": false,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 201.66666666666669,
- "t": 601.0,
- "r": 230.66666666666666,
- "b": 609.6666666666666,
+ "l": 121.66666666666663,
+ "t": 284.0,
+ "r": 168.66666666666663,
+ "b": 300.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -3351,17 +2660,93 @@
"end_row_offset_idx": 3,
"start_col_offset_idx": 0,
"end_col_offset_idx": 1,
- "text": "Some other column",
+ "text": "value",
"column_header": false,
- "row_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 232.33333333333326,
+ "t": 105.66666666666669,
+ "r": 363.6666666666667,
+ "b": 126.33333333333337,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Other merged column",
+ "column_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 247.0,
+ "t": 188.0,
+ "r": 349.6666666666667,
+ "b": 204.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Some other value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 247.0,
+ "t": 268.0,
+ "r": 349.6666666666667,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 2,
+ "end_row_offset_idx": 3,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Some other value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 406.3333333333333,
+ "t": 105.66666666666669,
+ "r": 518.0,
+ "b": 121.66666666666663,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another column",
+ "column_header": true,
+ "row_header": false,
"row_section": false
},
{
"bbox": {
"l": 408.3333333333333,
- "t": 554.6666666666666,
- "r": 437.3333333333333,
- "b": 563.3333333333334,
+ "t": 188.0,
+ "r": 514.0,
+ "b": 204.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -3370,84 +2755,27 @@
"end_row_offset_idx": 2,
"start_col_offset_idx": 2,
"end_col_offset_idx": 3,
- "text": "Some row",
+ "text": "Yet another value",
"column_header": false,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 299.0,
- "t": 554.6666666666666,
- "r": 326.33333333333337,
- "b": 561.0,
+ "l": 408.3333333333333,
+ "t": 268.0,
+ "r": 514.0,
+ "b": 284.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
"col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "some cell",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 190.0,
- "t": 554.6666666666666,
- "r": 213.66666666666666,
- "b": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "have content",
- "column_header": false,
- "row_header": true,
- "row_section": false
- },
- {
- "bbox": {
- "l": 422.6666666666667,
- "t": 508.3333333333333,
- "r": 451.6666666666667,
- "b": 517.0,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
+ "start_row_offset_idx": 2,
+ "end_row_offset_idx": 3,
"start_col_offset_idx": 2,
"end_col_offset_idx": 3,
- "text": "Some other row",
- "column_header": true,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 303.0,
- "t": 508.3333333333333,
- "r": 329.0,
- "b": 517.0,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "other don't",
- "column_header": true,
+ "text": "Yet another value",
+ "column_header": false,
"row_header": false,
"row_section": false
}
@@ -3462,20 +2790,20 @@
"assembled": {
"elements": [
{
- "label": "text",
- "id": 8,
+ "label": "table",
+ "id": 0,
"page_no": 0,
"cluster": {
- "id": 8,
- "label": "text",
+ "id": 0,
+ "label": "table",
"bbox": {
- "l": 194.03979,
- "t": 690.10254,
- "r": 410.73657,
- "b": 719.149414,
+ "l": 240.90093994140625,
+ "t": 277.41973876953125,
+ "r": 722.950309753418,
+ "b": 524.3504486083984,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7134009003639221,
+ "confidence": 0.9790865778923035,
"cells": [
{
"index": 0,
@@ -3486,43 +2814,22 @@
"a": 255
},
"rect": {
- "r_x0": 194.03979,
- "r_y0": 719.149414,
- "r_x1": 410.73657,
- "r_y1": 719.149414,
- "r_x2": 410.73657,
- "r_y2": 690.10254,
- "r_x3": 194.03979,
- "r_y3": 690.10254,
+ "r_x0": 694.6666666666666,
+ "r_y0": 485.66666666666663,
+ "r_x1": 602.0,
+ "r_y1": 485.66666666666663,
+ "r_x2": 602.0,
+ "r_y2": 506.3333333333333,
+ "r_x3": 694.6666666666666,
+ "r_y3": 506.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": " tset elbat a si sihT",
- "orig": " tset elbat a si sihT",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- }
- ],
- "children": []
- },
- "text": "tset elbat a si sihT"
- },
- {
- "label": "text",
- "id": 0,
- "page_no": 0,
- "cluster": {
- "id": 0,
- "label": "text",
- "bbox": {
- "l": 238.78076,
- "t": 655.42273,
- "r": 540.0,
- "b": 667.71179,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.8374139070510864,
- "cells": [
+ "confidence": 90.0,
+ "from_ocr": true
+ },
{
"index": 1,
"rgba": {
@@ -3532,21 +2839,21 @@
"a": 255
},
"rect": {
- "r_x0": 521.0545,
- "r_y0": 667.71179,
- "r_x1": 540.0,
- "r_y1": 667.71179,
- "r_x2": 540.0,
- "r_y2": 655.42273,
- "r_x3": 521.0545,
- "r_y3": 655.42273,
+ "r_x0": 680.0,
+ "r_y0": 454.33333333333337,
+ "r_x1": 610.0,
+ "r_y1": 454.33333333333337,
+ "r_x2": 610.0,
+ "r_y2": 475.0,
+ "r_x3": 680.0,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "ehT",
- "orig": "ehT",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
},
{
"index": 2,
@@ -3557,21 +2864,21 @@
"a": 255
},
"rect": {
- "r_x0": 518.00269,
- "r_y0": 667.71179,
- "r_x1": 518.00488,
- "r_y1": 667.71179,
- "r_x2": 518.00488,
- "r_y2": 655.42273,
- "r_x3": 518.00269,
- "r_y3": 655.42273,
+ "r_x0": 670.3333333333334,
+ "r_y0": 392.0,
+ "r_x1": 623.3333333333334,
+ "r_y1": 392.0,
+ "r_x2": 623.3333333333334,
+ "r_y2": 408.0,
+ "r_x3": 670.3333333333334,
+ "r_y3": 408.0,
"coord_origin": "TOPLEFT"
},
- "text": " t",
- "orig": " t",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 3,
@@ -3582,21 +2889,21 @@
"a": 255
},
"rect": {
- "r_x0": 503.33759000000003,
- "r_y0": 667.71179,
- "r_x1": 514.95093,
- "r_y1": 667.71179,
- "r_x2": 514.95093,
- "r_y2": 655.42273,
- "r_x3": 503.33759000000003,
- "r_y3": 655.42273,
+ "r_x0": 670.3333333333334,
+ "r_y0": 312.0,
+ "r_x1": 623.3333333333334,
+ "r_y1": 312.0,
+ "r_x2": 623.3333333333334,
+ "r_y2": 328.0,
+ "r_x3": 670.3333333333334,
+ "r_y3": 328.0,
"coord_origin": "TOPLEFT"
},
- "text": "se",
- "orig": "se",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 4,
@@ -3607,21 +2914,21 @@
"a": 255
},
"rect": {
- "r_x0": 500.28534,
- "r_y0": 667.71179,
- "r_x1": 500.28751,
- "r_y1": 667.71179,
- "r_x2": 500.28751,
- "r_y2": 655.42273,
- "r_x3": 500.28534,
- "r_y3": 655.42273,
+ "r_x0": 559.6666666666667,
+ "r_y0": 485.66666666666663,
+ "r_x1": 428.3333333333333,
+ "r_y1": 485.66666666666663,
+ "r_x2": 428.3333333333333,
+ "r_y2": 506.3333333333333,
+ "r_x3": 559.6666666666667,
+ "r_y3": 506.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "t ",
- "orig": "t ",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 5,
@@ -3632,21 +2939,21 @@
"a": 255
},
"rect": {
- "r_x0": 459.36172000000005,
- "r_y0": 667.71179,
- "r_x1": 497.23352,
- "r_y1": 667.71179,
- "r_x2": 497.23352,
- "r_y2": 655.42273,
- "r_x3": 459.36172000000005,
- "r_y3": 655.42273,
+ "r_x0": 526.6666666666667,
+ "r_y0": 459.0,
+ "r_x1": 456.0,
+ "r_y1": 459.0,
+ "r_x2": 456.0,
+ "r_y2": 475.0,
+ "r_x3": 526.6666666666667,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "w strats",
- "orig": "w strats",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 6,
@@ -3657,21 +2964,21 @@
"a": 255
},
"rect": {
- "r_x0": 456.92352,
- "r_y0": 667.71179,
- "r_x1": 456.92526,
- "r_y1": 667.71179,
- "r_x2": 456.92526,
- "r_y2": 655.42273,
- "r_x3": 456.92352,
- "r_y3": 655.42273,
+ "r_x0": 545.0,
+ "r_y0": 408.0,
+ "r_x1": 442.3333333333333,
+ "r_y1": 408.0,
+ "r_x2": 442.3333333333333,
+ "r_y2": 424.0,
+ "r_x3": 545.0,
+ "r_y3": 424.0,
"coord_origin": "TOPLEFT"
},
- "text": "it",
- "orig": "it",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 91.0,
+ "from_ocr": true
},
{
"index": 7,
@@ -3682,21 +2989,21 @@
"a": 255
},
"rect": {
- "r_x0": 377.49374,
- "r_y0": 667.71179,
- "r_x1": 453.87128,
- "r_y1": 667.71179,
- "r_x2": 453.87128,
- "r_y2": 655.42273,
- "r_x3": 377.49374,
- "r_y3": 655.42273,
+ "r_x0": 515.0,
+ "r_y0": 376.0,
+ "r_x1": 468.0,
+ "r_y1": 376.0,
+ "r_x2": 468.0,
+ "r_y2": 392.0,
+ "r_x3": 515.0,
+ "r_y3": 392.0,
"coord_origin": "TOPLEFT"
},
- "text": "modnar emos h",
- "orig": "modnar emos h",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 8,
@@ -3707,21 +3014,21 @@
"a": 255
},
"rect": {
- "r_x0": 374.44409,
- "r_y0": 667.71179,
- "r_x1": 374.44629,
- "r_y1": 667.71179,
- "r_x2": 374.44629,
- "r_y2": 655.42273,
- "r_x3": 374.44409,
- "r_y3": 655.42273,
+ "r_x0": 545.0,
+ "r_y0": 328.0,
+ "r_x1": 442.3333333333333,
+ "r_y1": 328.0,
+ "r_x2": 442.3333333333333,
+ "r_y2": 344.0,
+ "r_x3": 545.0,
+ "r_y3": 344.0,
"coord_origin": "TOPLEFT"
},
- "text": " t",
- "orig": " t",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 9,
@@ -3732,21 +3039,21 @@
"a": 255
},
"rect": {
- "r_x0": 359.77896,
- "r_y0": 667.71179,
- "r_x1": 371.3923,
- "r_y1": 667.71179,
- "r_x2": 371.3923,
- "r_y2": 655.42273,
- "r_x3": 359.77896,
- "r_y3": 655.42273,
+ "r_x0": 515.0,
+ "r_y0": 296.6666666666667,
+ "r_x1": 468.0,
+ "r_y1": 296.6666666666667,
+ "r_x2": 468.0,
+ "r_y2": 312.6666666666667,
+ "r_x3": 515.0,
+ "r_y3": 312.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "xe",
- "orig": "xe",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 10,
@@ -3757,21 +3064,21 @@
"a": 255
},
"rect": {
- "r_x0": 356.72672,
- "r_y0": 667.71179,
- "r_x1": 356.72888,
- "r_y1": 667.71179,
- "r_x2": 356.72888,
- "r_y2": 655.42273,
- "r_x3": 356.72672,
- "r_y3": 655.42273,
+ "r_x0": 385.6666666666667,
+ "r_y0": 490.33333333333337,
+ "r_x1": 274.0,
+ "r_y1": 490.33333333333337,
+ "r_x2": 274.0,
+ "r_y2": 506.3333333333333,
+ "r_x3": 385.6666666666667,
+ "r_y3": 506.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "t ",
- "orig": "t ",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 11,
@@ -3782,21 +3089,21 @@
"a": 255
},
"rect": {
- "r_x0": 335.3306,
- "r_y0": 667.71179,
- "r_x1": 353.67493,
- "r_y1": 667.71179,
- "r_x2": 353.67493,
- "r_y2": 655.42273,
- "r_x3": 335.3306,
- "r_y3": 655.42273,
+ "r_x0": 363.0,
+ "r_y0": 459.0,
+ "r_x1": 292.66666666666663,
+ "r_y1": 459.0,
+ "r_x2": 292.66666666666663,
+ "r_y2": 475.0,
+ "r_x3": 363.0,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "dna",
- "orig": "dna",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 12,
@@ -3807,21 +3114,21 @@
"a": 255
},
"rect": {
- "r_x0": 332.27878,
- "r_y0": 667.71179,
- "r_x1": 332.28094,
- "r_y1": 667.71179,
- "r_x2": 332.28094,
- "r_y2": 655.42273,
- "r_x3": 332.27878,
- "r_y3": 655.42273,
+ "r_x0": 383.6666666666667,
+ "r_y0": 408.0,
+ "r_x1": 278.0,
+ "r_y1": 408.0,
+ "r_x2": 278.0,
+ "r_y2": 424.0,
+ "r_x3": 383.6666666666667,
+ "r_y3": 424.0,
"coord_origin": "TOPLEFT"
},
- "text": " t",
- "orig": " t",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 13,
@@ -3832,21 +3139,21 @@
"a": 255
},
"rect": {
- "r_x0": 301.7153,
- "r_y0": 667.71179,
- "r_x1": 329.22699,
- "r_y1": 667.71179,
- "r_x2": 329.22699,
- "r_y2": 655.42273,
- "r_x3": 301.7153,
- "r_y3": 655.42273,
+ "r_x0": 351.33333333333337,
+ "r_y0": 376.0,
+ "r_x1": 304.33333333333337,
+ "r_y1": 376.0,
+ "r_x2": 304.33333333333337,
+ "r_y2": 392.0,
+ "r_x3": 351.33333333333337,
+ "r_y3": 392.0,
"coord_origin": "TOPLEFT"
},
- "text": "a neh",
- "orig": "a neh",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 14,
@@ -3857,21 +3164,21 @@
"a": 255
},
"rect": {
- "r_x0": 298.66348,
- "r_y0": 667.71179,
- "r_x1": 298.66565,
- "r_y1": 667.71179,
- "r_x2": 298.66565,
- "r_y2": 655.42273,
- "r_x3": 298.66348,
- "r_y3": 655.42273,
+ "r_x0": 383.6666666666667,
+ "r_y0": 328.0,
+ "r_x1": 278.0,
+ "r_y1": 328.0,
+ "r_x2": 278.0,
+ "r_y2": 344.0,
+ "r_x3": 383.6666666666667,
+ "r_y3": 344.0,
"coord_origin": "TOPLEFT"
},
- "text": " t",
- "orig": " t",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 15,
@@ -3882,599 +3189,38 @@
"a": 255
},
"rect": {
- "r_x0": 274.82526,
- "r_y0": 667.71179,
- "r_x1": 295.61169,
- "r_y1": 667.71179,
- "r_x2": 295.61169,
- "r_y2": 655.42273,
- "r_x3": 274.82526,
- "r_y3": 655.42273,
+ "r_x0": 351.33333333333337,
+ "r_y0": 296.6666666666667,
+ "r_x1": 304.33333333333337,
+ "r_y1": 296.6666666666667,
+ "r_x2": 304.33333333333337,
+ "r_y2": 312.6666666666667,
+ "r_x3": 351.33333333333337,
+ "r_y3": 312.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "elba",
- "orig": "elba",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- },
- {
- "index": 16,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 271.77344,
- "r_y0": 667.71179,
- "r_x1": 271.7756,
- "r_y1": 667.71179,
- "r_x2": 271.7756,
- "r_y2": 655.42273,
- "r_x3": 271.77344,
- "r_y3": 655.42273,
- "coord_origin": "TOPLEFT"
- },
- "text": " i",
- "orig": " i",
- "text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- },
- {
- "index": 17,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 241.83258,
- "r_y0": 667.71179,
- "r_x1": 269.3335,
- "r_y1": 667.71179,
- "r_x2": 269.3335,
- "r_y2": 655.42273,
- "r_x3": 241.83258,
- "r_y3": 655.42273,
- "coord_origin": "TOPLEFT"
- },
- "text": "egam",
- "orig": "egam",
- "text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- },
- {
- "index": 18,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 238.78076,
- "r_y0": 667.71179,
- "r_x1": 238.78296,
- "r_y1": 667.71179,
- "r_x2": 238.78296,
- "r_y2": 655.42273,
- "r_x3": 238.78076,
- "r_y3": 655.42273,
- "coord_origin": "TOPLEFT"
- },
- "text": ": ",
- "orig": ": ",
- "text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- }
- ],
- "children": []
- },
- "text": "ehT t se t w strats it modnar emos h t xe t dna t a neh t elba i egam :"
- },
- {
- "label": "table",
- "id": 9,
- "page_no": 0,
- "cluster": {
- "id": 9,
- "label": "table",
- "bbox": {
- "l": 112.69406127929688,
- "t": 489.72344970703125,
- "r": 470.0718078613281,
- "b": 628.2994995117188,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.6408323049545288,
- "cells": [
- {
- "index": 19,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 337.0,
- "r_y0": 601.0,
- "r_x1": 308.0,
- "r_y1": 601.0,
- "r_x2": 308.0,
- "r_y2": 609.6666666666666,
- "r_x3": 337.0,
- "r_y3": 609.6666666666666,
- "coord_origin": "TOPLEFT"
- },
- "text": "Some",
- "orig": "Some",
- "text_direction": "left_to_right",
- "confidence": 0.95841644,
- "from_ocr": true
- },
- {
- "index": 20,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 304.0,
- "r_y0": 601.0,
- "r_x1": 268.33333333333337,
- "r_y1": 601.0,
- "r_x2": 268.33333333333337,
- "r_y2": 609.3333333333334,
- "r_x3": 304.0,
- "r_y3": 609.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "column",
- "orig": "column",
- "text_direction": "left_to_right",
- "confidence": 0.95624527,
- "from_ocr": true
- },
- {
- "index": 21,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 230.66666666666666,
- "r_y0": 601.0,
- "r_x1": 201.66666666666669,
- "r_y1": 601.0,
- "r_x2": 201.66666666666669,
- "r_y2": 609.6666666666666,
- "r_x3": 230.66666666666666,
- "r_y3": 609.6666666666666,
- "coord_origin": "TOPLEFT"
- },
- "text": "Some",
- "orig": "Some",
- "text_direction": "left_to_right",
- "confidence": 0.96296555,
- "from_ocr": true
- },
- {
- "index": 22,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 197.66666666666669,
- "r_y0": 601.0,
- "r_x1": 172.0,
- "r_y1": 601.0,
- "r_x2": 172.0,
- "r_y2": 609.3333333333334,
- "r_x3": 197.66666666666669,
- "r_y3": 609.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.96467484,
- "from_ocr": true
- },
- {
- "index": 23,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 168.66666666666669,
- "r_y0": 601.0,
- "r_x1": 133.0,
- "r_y1": 601.0,
- "r_x2": 133.0,
- "r_y2": 609.3333333333334,
- "r_x3": 168.66666666666669,
- "r_y3": 609.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "column",
- "orig": "column",
- "text_direction": "left_to_right",
- "confidence": 0.95497986,
- "from_ocr": true
- },
- {
- "index": 24,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 437.3333333333333,
- "r_y0": 554.6666666666666,
- "r_x1": 408.3333333333333,
- "r_y1": 554.6666666666666,
- "r_x2": 408.3333333333333,
- "r_y2": 563.3333333333334,
- "r_x3": 437.3333333333333,
- "r_y3": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "Some",
- "orig": "Some",
- "text_direction": "left_to_right",
- "confidence": 0.95944489,
- "from_ocr": true
- },
- {
- "index": 25,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 404.0,
- "r_y0": 554.6666666666666,
- "r_x1": 386.3333333333333,
- "r_y1": 554.6666666666666,
- "r_x2": 386.3333333333333,
- "r_y2": 561.0,
- "r_x3": 404.0,
- "r_y3": 561.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "row",
- "orig": "row",
- "text_direction": "left_to_right",
- "confidence": 0.9680950199999999,
- "from_ocr": true
- },
- {
- "index": 26,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 326.33333333333337,
- "r_y0": 554.6666666666666,
- "r_x1": 299.0,
- "r_y1": 554.6666666666666,
- "r_x2": 299.0,
- "r_y2": 561.0,
- "r_x3": 326.33333333333337,
- "r_y3": 561.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "some",
- "orig": "some",
- "text_direction": "left_to_right",
- "confidence": 0.9569136,
- "from_ocr": true
- },
- {
- "index": 27,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 295.33333333333337,
- "r_y0": 554.6666666666666,
- "r_x1": 279.0,
- "r_y1": 554.6666666666666,
- "r_x2": 279.0,
- "r_y2": 563.3333333333334,
- "r_x3": 295.33333333333337,
- "r_y3": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "cell",
- "orig": "cell",
- "text_direction": "left_to_right",
- "confidence": 0.9622145799999999,
- "from_ocr": true
- },
- {
- "index": 28,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 213.66666666666666,
- "r_y0": 554.6666666666666,
- "r_x1": 190.0,
- "r_y1": 554.6666666666666,
- "r_x2": 190.0,
- "r_y2": 563.3333333333334,
- "r_x3": 213.66666666666666,
- "r_y3": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "have",
- "orig": "have",
- "text_direction": "left_to_right",
- "confidence": 0.96403,
- "from_ocr": true
- },
- {
- "index": 29,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 186.0,
- "r_y0": 554.6666666666666,
- "r_x1": 149.0,
- "r_y1": 554.6666666666666,
- "r_x2": 149.0,
- "r_y2": 563.0,
- "r_x3": 186.0,
- "r_y3": 563.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "content",
- "orig": "content",
- "text_direction": "left_to_right",
- "confidence": 0.96691612,
- "from_ocr": true
- },
- {
- "index": 30,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 451.6666666666667,
- "r_y0": 508.3333333333333,
- "r_x1": 422.6666666666667,
- "r_y1": 508.3333333333333,
- "r_x2": 422.6666666666667,
- "r_y2": 517.0,
- "r_x3": 451.6666666666667,
- "r_y3": 517.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "Some",
- "orig": "Some",
- "text_direction": "left_to_right",
- "confidence": 0.9684503200000001,
- "from_ocr": true
- },
- {
- "index": 31,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 419.0,
- "r_y0": 508.3333333333333,
- "r_x1": 393.0,
- "r_y1": 508.3333333333333,
- "r_x2": 393.0,
- "r_y2": 516.6666666666666,
- "r_x3": 419.0,
- "r_y3": 516.6666666666666,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.96073517,
- "from_ocr": true
- },
- {
- "index": 32,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 389.3333333333333,
- "r_y0": 508.3333333333333,
- "r_x1": 371.6666666666667,
- "r_y1": 508.3333333333333,
- "r_x2": 371.6666666666667,
- "r_y2": 514.6666666666666,
- "r_x3": 389.3333333333333,
- "r_y3": 514.6666666666666,
- "coord_origin": "TOPLEFT"
- },
- "text": "row",
- "orig": "row",
- "text_direction": "left_to_right",
- "confidence": 0.9615368700000001,
- "from_ocr": true
- },
- {
- "index": 33,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 329.0,
- "r_y0": 508.3333333333333,
- "r_x1": 303.0,
- "r_y1": 508.3333333333333,
- "r_x2": 303.0,
- "r_y2": 517.0,
- "r_x3": 329.0,
- "r_y3": 517.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.9626261100000001,
- "from_ocr": true
- },
- {
- "index": 34,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 299.66666666666663,
- "r_y0": 508.3333333333333,
- "r_x1": 275.66666666666663,
- "r_y1": 508.3333333333333,
- "r_x2": 275.66666666666663,
- "r_y2": 517.0,
- "r_x3": 299.66666666666663,
- "r_y3": 517.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "don't",
- "orig": "don't",
- "text_direction": "left_to_right",
- "confidence": 0.96669136,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": [
- {
- "id": 7,
- "label": "text",
- "bbox": {
- "l": 268.33333333333337,
- "t": 601.0,
- "r": 337.0,
- "b": 609.6666666666666,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.7441245913505554,
- "cells": [
- {
- "index": 19,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 337.0,
- "r_y0": 601.0,
- "r_x1": 308.0,
- "r_y1": 601.0,
- "r_x2": 308.0,
- "r_y2": 609.6666666666666,
- "r_x3": 337.0,
- "r_y3": 609.6666666666666,
- "coord_origin": "TOPLEFT"
- },
- "text": "Some",
- "orig": "Some",
- "text_direction": "left_to_right",
- "confidence": 0.95841644,
- "from_ocr": true
- },
- {
- "index": 20,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 304.0,
- "r_y0": 601.0,
- "r_x1": 268.33333333333337,
- "r_y1": 601.0,
- "r_x2": 268.33333333333337,
- "r_y2": 609.3333333333334,
- "r_x3": 304.0,
- "r_y3": 609.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "column",
- "orig": "column",
- "text_direction": "left_to_right",
- "confidence": 0.95624527,
- "from_ocr": true
- }
- ],
- "children": []
- },
{
"id": 1,
"label": "text",
"bbox": {
- "l": 133.0,
- "t": 601.0,
- "r": 230.66666666666666,
- "b": 609.6666666666666,
+ "l": 602.0,
+ "t": 485.66666666666663,
+ "r": 694.6666666666666,
+ "b": 506.3333333333333,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7668525576591492,
+ "confidence": 90.0,
"cells": [
{
- "index": 21,
+ "index": 0,
"rgba": {
"r": 0,
"g": 0,
@@ -4482,135 +3228,20 @@
"a": 255
},
"rect": {
- "r_x0": 230.66666666666666,
- "r_y0": 601.0,
- "r_x1": 201.66666666666669,
- "r_y1": 601.0,
- "r_x2": 201.66666666666669,
- "r_y2": 609.6666666666666,
- "r_x3": 230.66666666666666,
- "r_y3": 609.6666666666666,
+ "r_x0": 694.6666666666666,
+ "r_y0": 485.66666666666663,
+ "r_x1": 602.0,
+ "r_y1": 485.66666666666663,
+ "r_x2": 602.0,
+ "r_y2": 506.3333333333333,
+ "r_x3": 694.6666666666666,
+ "r_y3": 506.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 0.96296555,
- "from_ocr": true
- },
- {
- "index": 22,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 197.66666666666669,
- "r_y0": 601.0,
- "r_x1": 172.0,
- "r_y1": 601.0,
- "r_x2": 172.0,
- "r_y2": 609.3333333333334,
- "r_x3": 197.66666666666669,
- "r_y3": 609.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.96467484,
- "from_ocr": true
- },
- {
- "index": 23,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 168.66666666666669,
- "r_y0": 601.0,
- "r_x1": 133.0,
- "r_y1": 601.0,
- "r_x2": 133.0,
- "r_y2": 609.3333333333334,
- "r_x3": 168.66666666666669,
- "r_y3": 609.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "column",
- "orig": "column",
- "text_direction": "left_to_right",
- "confidence": 0.95497986,
- "from_ocr": true
- }
- ],
- "children": []
- },
- {
- "id": 4,
- "label": "text",
- "bbox": {
- "l": 386.3333333333333,
- "t": 554.6666666666666,
- "r": 437.3333333333333,
- "b": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.7588309049606323,
- "cells": [
- {
- "index": 24,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 437.3333333333333,
- "r_y0": 554.6666666666666,
- "r_x1": 408.3333333333333,
- "r_y1": 554.6666666666666,
- "r_x2": 408.3333333333333,
- "r_y2": 563.3333333333334,
- "r_x3": 437.3333333333333,
- "r_y3": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "Some",
- "orig": "Some",
- "text_direction": "left_to_right",
- "confidence": 0.95944489,
- "from_ocr": true
- },
- {
- "index": 25,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 404.0,
- "r_y0": 554.6666666666666,
- "r_x1": 386.3333333333333,
- "r_y1": 554.6666666666666,
- "r_x2": 386.3333333333333,
- "r_y2": 561.0,
- "r_x3": 404.0,
- "r_y3": 561.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "row",
- "orig": "row",
- "text_direction": "left_to_right",
- "confidence": 0.9680950199999999,
+ "confidence": 90.0,
"from_ocr": true
}
],
@@ -4620,16 +3251,16 @@
"id": 2,
"label": "text",
"bbox": {
- "l": 279.0,
- "t": 554.6666666666666,
- "r": 326.33333333333337,
- "b": 563.3333333333334,
+ "l": 610.0,
+ "t": 454.33333333333337,
+ "r": 680.0,
+ "b": 475.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7627862095832825,
+ "confidence": 90.0,
"cells": [
{
- "index": 26,
+ "index": 1,
"rgba": {
"r": 0,
"g": 0,
@@ -4637,110 +3268,20 @@
"a": 255
},
"rect": {
- "r_x0": 326.33333333333337,
- "r_y0": 554.6666666666666,
- "r_x1": 299.0,
- "r_y1": 554.6666666666666,
- "r_x2": 299.0,
- "r_y2": 561.0,
- "r_x3": 326.33333333333337,
- "r_y3": 561.0,
+ "r_x0": 680.0,
+ "r_y0": 454.33333333333337,
+ "r_x1": 610.0,
+ "r_y1": 454.33333333333337,
+ "r_x2": 610.0,
+ "r_y2": 475.0,
+ "r_x3": 680.0,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "some",
- "orig": "some",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 0.9569136,
- "from_ocr": true
- },
- {
- "index": 27,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 295.33333333333337,
- "r_y0": 554.6666666666666,
- "r_x1": 279.0,
- "r_y1": 554.6666666666666,
- "r_x2": 279.0,
- "r_y2": 563.3333333333334,
- "r_x3": 295.33333333333337,
- "r_y3": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "cell",
- "orig": "cell",
- "text_direction": "left_to_right",
- "confidence": 0.9622145799999999,
- "from_ocr": true
- }
- ],
- "children": []
- },
- {
- "id": 5,
- "label": "text",
- "bbox": {
- "l": 149.0,
- "t": 554.6666666666666,
- "r": 213.66666666666666,
- "b": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.7541249394416809,
- "cells": [
- {
- "index": 28,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 213.66666666666666,
- "r_y0": 554.6666666666666,
- "r_x1": 190.0,
- "r_y1": 554.6666666666666,
- "r_x2": 190.0,
- "r_y2": 563.3333333333334,
- "r_x3": 213.66666666666666,
- "r_y3": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "have",
- "orig": "have",
- "text_direction": "left_to_right",
- "confidence": 0.96403,
- "from_ocr": true
- },
- {
- "index": 29,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 186.0,
- "r_y0": 554.6666666666666,
- "r_x1": 149.0,
- "r_y1": 554.6666666666666,
- "r_x2": 149.0,
- "r_y2": 563.0,
- "r_x3": 186.0,
- "r_y3": 563.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "content",
- "orig": "content",
- "text_direction": "left_to_right",
- "confidence": 0.96691612,
+ "confidence": 90.0,
"from_ocr": true
}
],
@@ -4750,16 +3291,16 @@
"id": 3,
"label": "text",
"bbox": {
- "l": 371.6666666666667,
- "t": 508.3333333333333,
- "r": 451.6666666666667,
- "b": 517.0,
+ "l": 623.3333333333334,
+ "t": 392.0,
+ "r": 670.3333333333334,
+ "b": 408.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7616423964500427,
+ "confidence": 96.0,
"cells": [
{
- "index": 30,
+ "index": 2,
"rgba": {
"r": 0,
"g": 0,
@@ -4767,24 +3308,39 @@
"a": 255
},
"rect": {
- "r_x0": 451.6666666666667,
- "r_y0": 508.3333333333333,
- "r_x1": 422.6666666666667,
- "r_y1": 508.3333333333333,
- "r_x2": 422.6666666666667,
- "r_y2": 517.0,
- "r_x3": 451.6666666666667,
- "r_y3": 517.0,
+ "r_x0": 670.3333333333334,
+ "r_y0": 392.0,
+ "r_x1": 623.3333333333334,
+ "r_y1": 392.0,
+ "r_x2": 623.3333333333334,
+ "r_y2": 408.0,
+ "r_x3": 670.3333333333334,
+ "r_y3": 408.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9684503200000001,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 4,
+ "label": "text",
+ "bbox": {
+ "l": 623.3333333333334,
+ "t": 312.0,
+ "r": 670.3333333333334,
+ "b": 328.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
{
- "index": 31,
+ "index": 3,
"rgba": {
"r": 0,
"g": 0,
@@ -4792,24 +3348,39 @@
"a": 255
},
"rect": {
- "r_x0": 419.0,
- "r_y0": 508.3333333333333,
- "r_x1": 393.0,
- "r_y1": 508.3333333333333,
- "r_x2": 393.0,
- "r_y2": 516.6666666666666,
- "r_x3": 419.0,
- "r_y3": 516.6666666666666,
+ "r_x0": 670.3333333333334,
+ "r_y0": 312.0,
+ "r_x1": 623.3333333333334,
+ "r_y1": 312.0,
+ "r_x2": 623.3333333333334,
+ "r_y2": 328.0,
+ "r_x3": 670.3333333333334,
+ "r_y3": 328.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96073517,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 5,
+ "label": "text",
+ "bbox": {
+ "l": 428.3333333333333,
+ "t": 485.66666666666663,
+ "r": 559.6666666666667,
+ "b": 506.3333333333333,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 92.0,
+ "cells": [
{
- "index": 32,
+ "index": 4,
"rgba": {
"r": 0,
"g": 0,
@@ -4817,20 +3388,20 @@
"a": 255
},
"rect": {
- "r_x0": 389.3333333333333,
- "r_y0": 508.3333333333333,
- "r_x1": 371.6666666666667,
- "r_y1": 508.3333333333333,
- "r_x2": 371.6666666666667,
- "r_y2": 514.6666666666666,
- "r_x3": 389.3333333333333,
- "r_y3": 514.6666666666666,
+ "r_x0": 559.6666666666667,
+ "r_y0": 485.66666666666663,
+ "r_x1": 428.3333333333333,
+ "r_y1": 485.66666666666663,
+ "r_x2": 428.3333333333333,
+ "r_y2": 506.3333333333333,
+ "r_x3": 559.6666666666667,
+ "r_y3": 506.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 0.9615368700000001,
+ "confidence": 92.0,
"from_ocr": true
}
],
@@ -4840,16 +3411,16 @@
"id": 6,
"label": "text",
"bbox": {
- "l": 275.66666666666663,
- "t": 508.3333333333333,
- "r": 329.0,
- "b": 517.0,
+ "l": 456.0,
+ "t": 459.0,
+ "r": 526.6666666666667,
+ "b": 475.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7468306422233582,
+ "confidence": 94.0,
"cells": [
{
- "index": 33,
+ "index": 5,
"rgba": {
"r": 0,
"g": 0,
@@ -4857,24 +3428,39 @@
"a": 255
},
"rect": {
- "r_x0": 329.0,
- "r_y0": 508.3333333333333,
- "r_x1": 303.0,
- "r_y1": 508.3333333333333,
- "r_x2": 303.0,
- "r_y2": 517.0,
- "r_x3": 329.0,
- "r_y3": 517.0,
+ "r_x0": 526.6666666666667,
+ "r_y0": 459.0,
+ "r_x1": 456.0,
+ "r_y1": 459.0,
+ "r_x2": 456.0,
+ "r_y2": 475.0,
+ "r_x3": 526.6666666666667,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9626261100000001,
+ "confidence": 94.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 7,
+ "label": "text",
+ "bbox": {
+ "l": 442.3333333333333,
+ "t": 408.0,
+ "r": 545.0,
+ "b": 424.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 91.0,
+ "cells": [
{
- "index": 34,
+ "index": 6,
"rgba": {
"r": 0,
"g": 0,
@@ -4882,20 +3468,380 @@
"a": 255
},
"rect": {
- "r_x0": 299.66666666666663,
- "r_y0": 508.3333333333333,
- "r_x1": 275.66666666666663,
- "r_y1": 508.3333333333333,
- "r_x2": 275.66666666666663,
- "r_y2": 517.0,
- "r_x3": 299.66666666666663,
- "r_y3": 517.0,
+ "r_x0": 545.0,
+ "r_y0": 408.0,
+ "r_x1": 442.3333333333333,
+ "r_y1": 408.0,
+ "r_x2": 442.3333333333333,
+ "r_y2": 424.0,
+ "r_x3": 545.0,
+ "r_y3": 424.0,
"coord_origin": "TOPLEFT"
},
- "text": "don't",
- "orig": "don't",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.96669136,
+ "confidence": 91.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 8,
+ "label": "text",
+ "bbox": {
+ "l": 468.0,
+ "t": 376.0,
+ "r": 515.0,
+ "b": 392.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
+ {
+ "index": 7,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 515.0,
+ "r_y0": 376.0,
+ "r_x1": 468.0,
+ "r_y1": 376.0,
+ "r_x2": 468.0,
+ "r_y2": 392.0,
+ "r_x3": 515.0,
+ "r_y3": 392.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 9,
+ "label": "text",
+ "bbox": {
+ "l": 442.3333333333333,
+ "t": 328.0,
+ "r": 545.0,
+ "b": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
+ {
+ "index": 8,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 545.0,
+ "r_y0": 328.0,
+ "r_x1": 442.3333333333333,
+ "r_y1": 328.0,
+ "r_x2": 442.3333333333333,
+ "r_y2": 344.0,
+ "r_x3": 545.0,
+ "r_y3": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Some other",
+ "orig": "Some other",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 10,
+ "label": "text",
+ "bbox": {
+ "l": 468.0,
+ "t": 296.6666666666667,
+ "r": 515.0,
+ "b": 312.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 9,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 515.0,
+ "r_y0": 296.6666666666667,
+ "r_x1": 468.0,
+ "r_y1": 296.6666666666667,
+ "r_x2": 468.0,
+ "r_y2": 312.6666666666667,
+ "r_x3": 515.0,
+ "r_y3": 312.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 11,
+ "label": "text",
+ "bbox": {
+ "l": 274.0,
+ "t": 490.33333333333337,
+ "r": 385.6666666666667,
+ "b": 506.3333333333333,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 10,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 385.6666666666667,
+ "r_y0": 490.33333333333337,
+ "r_x1": 274.0,
+ "r_y1": 490.33333333333337,
+ "r_x2": 274.0,
+ "r_y2": 506.3333333333333,
+ "r_x3": 385.6666666666667,
+ "r_y3": 506.3333333333333,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 12,
+ "label": "text",
+ "bbox": {
+ "l": 292.66666666666663,
+ "t": 459.0,
+ "r": 363.0,
+ "b": 475.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
+ {
+ "index": 11,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 363.0,
+ "r_y0": 459.0,
+ "r_x1": 292.66666666666663,
+ "r_y1": 459.0,
+ "r_x2": 292.66666666666663,
+ "r_y2": 475.0,
+ "r_x3": 363.0,
+ "r_y3": 475.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "column",
+ "orig": "column",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 13,
+ "label": "text",
+ "bbox": {
+ "l": 278.0,
+ "t": 408.0,
+ "r": 383.6666666666667,
+ "b": 424.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
+ {
+ "index": 12,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 383.6666666666667,
+ "r_y0": 408.0,
+ "r_x1": 278.0,
+ "r_y1": 408.0,
+ "r_x2": 278.0,
+ "r_y2": 424.0,
+ "r_x3": 383.6666666666667,
+ "r_y3": 424.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 14,
+ "label": "text",
+ "bbox": {
+ "l": 304.33333333333337,
+ "t": 376.0,
+ "r": 351.33333333333337,
+ "b": 392.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 351.33333333333337,
+ "r_y0": 376.0,
+ "r_x1": 304.33333333333337,
+ "r_y1": 376.0,
+ "r_x2": 304.33333333333337,
+ "r_y2": 392.0,
+ "r_x3": 351.33333333333337,
+ "r_y3": 392.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 15,
+ "label": "text",
+ "bbox": {
+ "l": 278.0,
+ "t": 328.0,
+ "r": 383.6666666666667,
+ "b": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 383.6666666666667,
+ "r_y0": 328.0,
+ "r_x1": 278.0,
+ "r_y1": 328.0,
+ "r_x2": 278.0,
+ "r_y2": 344.0,
+ "r_x3": 383.6666666666667,
+ "r_y3": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 16,
+ "label": "text",
+ "bbox": {
+ "l": 304.33333333333337,
+ "t": 296.6666666666667,
+ "r": 351.33333333333337,
+ "b": 312.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 351.33333333333337,
+ "r_y0": 296.6666666666667,
+ "r_x1": 304.33333333333337,
+ "r_y1": 296.6666666666667,
+ "r_x2": 304.33333333333337,
+ "r_y2": 312.6666666666667,
+ "r_x3": 351.33333333333337,
+ "r_y3": 312.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
"from_ocr": true
}
],
@@ -4905,17 +3851,17 @@
},
"text": null,
"otsl_seq": [
- "ecel",
+ "ched",
"ched",
"ched",
"nl",
- "rhed",
+ "fcel",
"fcel",
"fcel",
"nl",
- "rhed",
"fcel",
- "ecel",
+ "fcel",
+ "fcel",
"nl"
],
"num_rows": 3,
@@ -4923,29 +3869,48 @@
"table_cells": [
{
"bbox": {
- "l": 308.0,
- "t": 601.0,
- "r": 337.0,
- "b": 609.6666666666666,
+ "l": 97.33333333333337,
+ "t": 105.66666666666669,
+ "r": 190.0,
+ "b": 126.33333333333337,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
"col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "Some column",
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 0,
+ "end_col_offset_idx": 1,
+ "text": "Vertically merged",
+ "column_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 121.66666666666663,
+ "t": 204.0,
+ "r": 168.66666666666663,
+ "b": 220.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 0,
+ "end_col_offset_idx": 1,
+ "text": "value",
"column_header": false,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 201.66666666666669,
- "t": 601.0,
- "r": 230.66666666666666,
- "b": 609.6666666666666,
+ "l": 121.66666666666663,
+ "t": 284.0,
+ "r": 168.66666666666663,
+ "b": 300.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -4954,17 +3919,93 @@
"end_row_offset_idx": 3,
"start_col_offset_idx": 0,
"end_col_offset_idx": 1,
- "text": "Some other column",
+ "text": "value",
"column_header": false,
- "row_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 232.33333333333326,
+ "t": 105.66666666666669,
+ "r": 363.6666666666667,
+ "b": 126.33333333333337,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Other merged column",
+ "column_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 247.0,
+ "t": 188.0,
+ "r": 349.6666666666667,
+ "b": 204.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Some other value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 247.0,
+ "t": 268.0,
+ "r": 349.6666666666667,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 2,
+ "end_row_offset_idx": 3,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Some other value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 406.3333333333333,
+ "t": 105.66666666666669,
+ "r": 518.0,
+ "b": 121.66666666666663,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another column",
+ "column_header": true,
+ "row_header": false,
"row_section": false
},
{
"bbox": {
"l": 408.3333333333333,
- "t": 554.6666666666666,
- "r": 437.3333333333333,
- "b": 563.3333333333334,
+ "t": 188.0,
+ "r": 514.0,
+ "b": 204.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -4973,84 +4014,27 @@
"end_row_offset_idx": 2,
"start_col_offset_idx": 2,
"end_col_offset_idx": 3,
- "text": "Some row",
+ "text": "Yet another value",
"column_header": false,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 299.0,
- "t": 554.6666666666666,
- "r": 326.33333333333337,
- "b": 561.0,
+ "l": 408.3333333333333,
+ "t": 268.0,
+ "r": 514.0,
+ "b": 284.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
"col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "some cell",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 190.0,
- "t": 554.6666666666666,
- "r": 213.66666666666666,
- "b": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "have content",
- "column_header": false,
- "row_header": true,
- "row_section": false
- },
- {
- "bbox": {
- "l": 422.6666666666667,
- "t": 508.3333333333333,
- "r": 451.6666666666667,
- "b": 517.0,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
+ "start_row_offset_idx": 2,
+ "end_row_offset_idx": 3,
"start_col_offset_idx": 2,
"end_col_offset_idx": 3,
- "text": "Some other row",
- "column_header": true,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 303.0,
- "t": 508.3333333333333,
- "r": 329.0,
- "b": 517.0,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "other don't",
- "column_header": true,
+ "text": "Yet another value",
+ "column_header": false,
"row_header": false,
"row_section": false
}
@@ -5059,20 +4043,20 @@
],
"body": [
{
- "label": "text",
- "id": 8,
+ "label": "table",
+ "id": 0,
"page_no": 0,
"cluster": {
- "id": 8,
- "label": "text",
+ "id": 0,
+ "label": "table",
"bbox": {
- "l": 194.03979,
- "t": 690.10254,
- "r": 410.73657,
- "b": 719.149414,
+ "l": 240.90093994140625,
+ "t": 277.41973876953125,
+ "r": 722.950309753418,
+ "b": 524.3504486083984,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7134009003639221,
+ "confidence": 0.9790865778923035,
"cells": [
{
"index": 0,
@@ -5083,43 +4067,22 @@
"a": 255
},
"rect": {
- "r_x0": 194.03979,
- "r_y0": 719.149414,
- "r_x1": 410.73657,
- "r_y1": 719.149414,
- "r_x2": 410.73657,
- "r_y2": 690.10254,
- "r_x3": 194.03979,
- "r_y3": 690.10254,
+ "r_x0": 694.6666666666666,
+ "r_y0": 485.66666666666663,
+ "r_x1": 602.0,
+ "r_y1": 485.66666666666663,
+ "r_x2": 602.0,
+ "r_y2": 506.3333333333333,
+ "r_x3": 694.6666666666666,
+ "r_y3": 506.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": " tset elbat a si sihT",
- "orig": " tset elbat a si sihT",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- }
- ],
- "children": []
- },
- "text": "tset elbat a si sihT"
- },
- {
- "label": "text",
- "id": 0,
- "page_no": 0,
- "cluster": {
- "id": 0,
- "label": "text",
- "bbox": {
- "l": 238.78076,
- "t": 655.42273,
- "r": 540.0,
- "b": 667.71179,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.8374139070510864,
- "cells": [
+ "confidence": 90.0,
+ "from_ocr": true
+ },
{
"index": 1,
"rgba": {
@@ -5129,21 +4092,21 @@
"a": 255
},
"rect": {
- "r_x0": 521.0545,
- "r_y0": 667.71179,
- "r_x1": 540.0,
- "r_y1": 667.71179,
- "r_x2": 540.0,
- "r_y2": 655.42273,
- "r_x3": 521.0545,
- "r_y3": 655.42273,
+ "r_x0": 680.0,
+ "r_y0": 454.33333333333337,
+ "r_x1": 610.0,
+ "r_y1": 454.33333333333337,
+ "r_x2": 610.0,
+ "r_y2": 475.0,
+ "r_x3": 680.0,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "ehT",
- "orig": "ehT",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
},
{
"index": 2,
@@ -5154,21 +4117,21 @@
"a": 255
},
"rect": {
- "r_x0": 518.00269,
- "r_y0": 667.71179,
- "r_x1": 518.00488,
- "r_y1": 667.71179,
- "r_x2": 518.00488,
- "r_y2": 655.42273,
- "r_x3": 518.00269,
- "r_y3": 655.42273,
+ "r_x0": 670.3333333333334,
+ "r_y0": 392.0,
+ "r_x1": 623.3333333333334,
+ "r_y1": 392.0,
+ "r_x2": 623.3333333333334,
+ "r_y2": 408.0,
+ "r_x3": 670.3333333333334,
+ "r_y3": 408.0,
"coord_origin": "TOPLEFT"
},
- "text": " t",
- "orig": " t",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 3,
@@ -5179,21 +4142,21 @@
"a": 255
},
"rect": {
- "r_x0": 503.33759000000003,
- "r_y0": 667.71179,
- "r_x1": 514.95093,
- "r_y1": 667.71179,
- "r_x2": 514.95093,
- "r_y2": 655.42273,
- "r_x3": 503.33759000000003,
- "r_y3": 655.42273,
+ "r_x0": 670.3333333333334,
+ "r_y0": 312.0,
+ "r_x1": 623.3333333333334,
+ "r_y1": 312.0,
+ "r_x2": 623.3333333333334,
+ "r_y2": 328.0,
+ "r_x3": 670.3333333333334,
+ "r_y3": 328.0,
"coord_origin": "TOPLEFT"
},
- "text": "se",
- "orig": "se",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 4,
@@ -5204,21 +4167,21 @@
"a": 255
},
"rect": {
- "r_x0": 500.28534,
- "r_y0": 667.71179,
- "r_x1": 500.28751,
- "r_y1": 667.71179,
- "r_x2": 500.28751,
- "r_y2": 655.42273,
- "r_x3": 500.28534,
- "r_y3": 655.42273,
+ "r_x0": 559.6666666666667,
+ "r_y0": 485.66666666666663,
+ "r_x1": 428.3333333333333,
+ "r_y1": 485.66666666666663,
+ "r_x2": 428.3333333333333,
+ "r_y2": 506.3333333333333,
+ "r_x3": 559.6666666666667,
+ "r_y3": 506.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "t ",
- "orig": "t ",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 5,
@@ -5229,21 +4192,21 @@
"a": 255
},
"rect": {
- "r_x0": 459.36172000000005,
- "r_y0": 667.71179,
- "r_x1": 497.23352,
- "r_y1": 667.71179,
- "r_x2": 497.23352,
- "r_y2": 655.42273,
- "r_x3": 459.36172000000005,
- "r_y3": 655.42273,
+ "r_x0": 526.6666666666667,
+ "r_y0": 459.0,
+ "r_x1": 456.0,
+ "r_y1": 459.0,
+ "r_x2": 456.0,
+ "r_y2": 475.0,
+ "r_x3": 526.6666666666667,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "w strats",
- "orig": "w strats",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 6,
@@ -5254,21 +4217,21 @@
"a": 255
},
"rect": {
- "r_x0": 456.92352,
- "r_y0": 667.71179,
- "r_x1": 456.92526,
- "r_y1": 667.71179,
- "r_x2": 456.92526,
- "r_y2": 655.42273,
- "r_x3": 456.92352,
- "r_y3": 655.42273,
+ "r_x0": 545.0,
+ "r_y0": 408.0,
+ "r_x1": 442.3333333333333,
+ "r_y1": 408.0,
+ "r_x2": 442.3333333333333,
+ "r_y2": 424.0,
+ "r_x3": 545.0,
+ "r_y3": 424.0,
"coord_origin": "TOPLEFT"
},
- "text": "it",
- "orig": "it",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 91.0,
+ "from_ocr": true
},
{
"index": 7,
@@ -5279,21 +4242,21 @@
"a": 255
},
"rect": {
- "r_x0": 377.49374,
- "r_y0": 667.71179,
- "r_x1": 453.87128,
- "r_y1": 667.71179,
- "r_x2": 453.87128,
- "r_y2": 655.42273,
- "r_x3": 377.49374,
- "r_y3": 655.42273,
+ "r_x0": 515.0,
+ "r_y0": 376.0,
+ "r_x1": 468.0,
+ "r_y1": 376.0,
+ "r_x2": 468.0,
+ "r_y2": 392.0,
+ "r_x3": 515.0,
+ "r_y3": 392.0,
"coord_origin": "TOPLEFT"
},
- "text": "modnar emos h",
- "orig": "modnar emos h",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 8,
@@ -5304,21 +4267,21 @@
"a": 255
},
"rect": {
- "r_x0": 374.44409,
- "r_y0": 667.71179,
- "r_x1": 374.44629,
- "r_y1": 667.71179,
- "r_x2": 374.44629,
- "r_y2": 655.42273,
- "r_x3": 374.44409,
- "r_y3": 655.42273,
+ "r_x0": 545.0,
+ "r_y0": 328.0,
+ "r_x1": 442.3333333333333,
+ "r_y1": 328.0,
+ "r_x2": 442.3333333333333,
+ "r_y2": 344.0,
+ "r_x3": 545.0,
+ "r_y3": 344.0,
"coord_origin": "TOPLEFT"
},
- "text": " t",
- "orig": " t",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 9,
@@ -5329,21 +4292,21 @@
"a": 255
},
"rect": {
- "r_x0": 359.77896,
- "r_y0": 667.71179,
- "r_x1": 371.3923,
- "r_y1": 667.71179,
- "r_x2": 371.3923,
- "r_y2": 655.42273,
- "r_x3": 359.77896,
- "r_y3": 655.42273,
+ "r_x0": 515.0,
+ "r_y0": 296.6666666666667,
+ "r_x1": 468.0,
+ "r_y1": 296.6666666666667,
+ "r_x2": 468.0,
+ "r_y2": 312.6666666666667,
+ "r_x3": 515.0,
+ "r_y3": 312.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "xe",
- "orig": "xe",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 10,
@@ -5354,21 +4317,21 @@
"a": 255
},
"rect": {
- "r_x0": 356.72672,
- "r_y0": 667.71179,
- "r_x1": 356.72888,
- "r_y1": 667.71179,
- "r_x2": 356.72888,
- "r_y2": 655.42273,
- "r_x3": 356.72672,
- "r_y3": 655.42273,
+ "r_x0": 385.6666666666667,
+ "r_y0": 490.33333333333337,
+ "r_x1": 274.0,
+ "r_y1": 490.33333333333337,
+ "r_x2": 274.0,
+ "r_y2": 506.3333333333333,
+ "r_x3": 385.6666666666667,
+ "r_y3": 506.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "t ",
- "orig": "t ",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 11,
@@ -5379,21 +4342,21 @@
"a": 255
},
"rect": {
- "r_x0": 335.3306,
- "r_y0": 667.71179,
- "r_x1": 353.67493,
- "r_y1": 667.71179,
- "r_x2": 353.67493,
- "r_y2": 655.42273,
- "r_x3": 335.3306,
- "r_y3": 655.42273,
+ "r_x0": 363.0,
+ "r_y0": 459.0,
+ "r_x1": 292.66666666666663,
+ "r_y1": 459.0,
+ "r_x2": 292.66666666666663,
+ "r_y2": 475.0,
+ "r_x3": 363.0,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "dna",
- "orig": "dna",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 12,
@@ -5404,21 +4367,21 @@
"a": 255
},
"rect": {
- "r_x0": 332.27878,
- "r_y0": 667.71179,
- "r_x1": 332.28094,
- "r_y1": 667.71179,
- "r_x2": 332.28094,
- "r_y2": 655.42273,
- "r_x3": 332.27878,
- "r_y3": 655.42273,
+ "r_x0": 383.6666666666667,
+ "r_y0": 408.0,
+ "r_x1": 278.0,
+ "r_y1": 408.0,
+ "r_x2": 278.0,
+ "r_y2": 424.0,
+ "r_x3": 383.6666666666667,
+ "r_y3": 424.0,
"coord_origin": "TOPLEFT"
},
- "text": " t",
- "orig": " t",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 13,
@@ -5429,21 +4392,21 @@
"a": 255
},
"rect": {
- "r_x0": 301.7153,
- "r_y0": 667.71179,
- "r_x1": 329.22699,
- "r_y1": 667.71179,
- "r_x2": 329.22699,
- "r_y2": 655.42273,
- "r_x3": 301.7153,
- "r_y3": 655.42273,
+ "r_x0": 351.33333333333337,
+ "r_y0": 376.0,
+ "r_x1": 304.33333333333337,
+ "r_y1": 376.0,
+ "r_x2": 304.33333333333337,
+ "r_y2": 392.0,
+ "r_x3": 351.33333333333337,
+ "r_y3": 392.0,
"coord_origin": "TOPLEFT"
},
- "text": "a neh",
- "orig": "a neh",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 14,
@@ -5454,21 +4417,21 @@
"a": 255
},
"rect": {
- "r_x0": 298.66348,
- "r_y0": 667.71179,
- "r_x1": 298.66565,
- "r_y1": 667.71179,
- "r_x2": 298.66565,
- "r_y2": 655.42273,
- "r_x3": 298.66348,
- "r_y3": 655.42273,
+ "r_x0": 383.6666666666667,
+ "r_y0": 328.0,
+ "r_x1": 278.0,
+ "r_y1": 328.0,
+ "r_x2": 278.0,
+ "r_y2": 344.0,
+ "r_x3": 383.6666666666667,
+ "r_y3": 344.0,
"coord_origin": "TOPLEFT"
},
- "text": " t",
- "orig": " t",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 15,
@@ -5479,599 +4442,38 @@
"a": 255
},
"rect": {
- "r_x0": 274.82526,
- "r_y0": 667.71179,
- "r_x1": 295.61169,
- "r_y1": 667.71179,
- "r_x2": 295.61169,
- "r_y2": 655.42273,
- "r_x3": 274.82526,
- "r_y3": 655.42273,
+ "r_x0": 351.33333333333337,
+ "r_y0": 296.6666666666667,
+ "r_x1": 304.33333333333337,
+ "r_y1": 296.6666666666667,
+ "r_x2": 304.33333333333337,
+ "r_y2": 312.6666666666667,
+ "r_x3": 351.33333333333337,
+ "r_y3": 312.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "elba",
- "orig": "elba",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- },
- {
- "index": 16,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 271.77344,
- "r_y0": 667.71179,
- "r_x1": 271.7756,
- "r_y1": 667.71179,
- "r_x2": 271.7756,
- "r_y2": 655.42273,
- "r_x3": 271.77344,
- "r_y3": 655.42273,
- "coord_origin": "TOPLEFT"
- },
- "text": " i",
- "orig": " i",
- "text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- },
- {
- "index": 17,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 241.83258,
- "r_y0": 667.71179,
- "r_x1": 269.3335,
- "r_y1": 667.71179,
- "r_x2": 269.3335,
- "r_y2": 655.42273,
- "r_x3": 241.83258,
- "r_y3": 655.42273,
- "coord_origin": "TOPLEFT"
- },
- "text": "egam",
- "orig": "egam",
- "text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- },
- {
- "index": 18,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 238.78076,
- "r_y0": 667.71179,
- "r_x1": 238.78296,
- "r_y1": 667.71179,
- "r_x2": 238.78296,
- "r_y2": 655.42273,
- "r_x3": 238.78076,
- "r_y3": 655.42273,
- "coord_origin": "TOPLEFT"
- },
- "text": ": ",
- "orig": ": ",
- "text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- }
- ],
- "children": []
- },
- "text": "ehT t se t w strats it modnar emos h t xe t dna t a neh t elba i egam :"
- },
- {
- "label": "table",
- "id": 9,
- "page_no": 0,
- "cluster": {
- "id": 9,
- "label": "table",
- "bbox": {
- "l": 112.69406127929688,
- "t": 489.72344970703125,
- "r": 470.0718078613281,
- "b": 628.2994995117188,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.6408323049545288,
- "cells": [
- {
- "index": 19,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 337.0,
- "r_y0": 601.0,
- "r_x1": 308.0,
- "r_y1": 601.0,
- "r_x2": 308.0,
- "r_y2": 609.6666666666666,
- "r_x3": 337.0,
- "r_y3": 609.6666666666666,
- "coord_origin": "TOPLEFT"
- },
- "text": "Some",
- "orig": "Some",
- "text_direction": "left_to_right",
- "confidence": 0.95841644,
- "from_ocr": true
- },
- {
- "index": 20,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 304.0,
- "r_y0": 601.0,
- "r_x1": 268.33333333333337,
- "r_y1": 601.0,
- "r_x2": 268.33333333333337,
- "r_y2": 609.3333333333334,
- "r_x3": 304.0,
- "r_y3": 609.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "column",
- "orig": "column",
- "text_direction": "left_to_right",
- "confidence": 0.95624527,
- "from_ocr": true
- },
- {
- "index": 21,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 230.66666666666666,
- "r_y0": 601.0,
- "r_x1": 201.66666666666669,
- "r_y1": 601.0,
- "r_x2": 201.66666666666669,
- "r_y2": 609.6666666666666,
- "r_x3": 230.66666666666666,
- "r_y3": 609.6666666666666,
- "coord_origin": "TOPLEFT"
- },
- "text": "Some",
- "orig": "Some",
- "text_direction": "left_to_right",
- "confidence": 0.96296555,
- "from_ocr": true
- },
- {
- "index": 22,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 197.66666666666669,
- "r_y0": 601.0,
- "r_x1": 172.0,
- "r_y1": 601.0,
- "r_x2": 172.0,
- "r_y2": 609.3333333333334,
- "r_x3": 197.66666666666669,
- "r_y3": 609.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.96467484,
- "from_ocr": true
- },
- {
- "index": 23,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 168.66666666666669,
- "r_y0": 601.0,
- "r_x1": 133.0,
- "r_y1": 601.0,
- "r_x2": 133.0,
- "r_y2": 609.3333333333334,
- "r_x3": 168.66666666666669,
- "r_y3": 609.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "column",
- "orig": "column",
- "text_direction": "left_to_right",
- "confidence": 0.95497986,
- "from_ocr": true
- },
- {
- "index": 24,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 437.3333333333333,
- "r_y0": 554.6666666666666,
- "r_x1": 408.3333333333333,
- "r_y1": 554.6666666666666,
- "r_x2": 408.3333333333333,
- "r_y2": 563.3333333333334,
- "r_x3": 437.3333333333333,
- "r_y3": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "Some",
- "orig": "Some",
- "text_direction": "left_to_right",
- "confidence": 0.95944489,
- "from_ocr": true
- },
- {
- "index": 25,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 404.0,
- "r_y0": 554.6666666666666,
- "r_x1": 386.3333333333333,
- "r_y1": 554.6666666666666,
- "r_x2": 386.3333333333333,
- "r_y2": 561.0,
- "r_x3": 404.0,
- "r_y3": 561.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "row",
- "orig": "row",
- "text_direction": "left_to_right",
- "confidence": 0.9680950199999999,
- "from_ocr": true
- },
- {
- "index": 26,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 326.33333333333337,
- "r_y0": 554.6666666666666,
- "r_x1": 299.0,
- "r_y1": 554.6666666666666,
- "r_x2": 299.0,
- "r_y2": 561.0,
- "r_x3": 326.33333333333337,
- "r_y3": 561.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "some",
- "orig": "some",
- "text_direction": "left_to_right",
- "confidence": 0.9569136,
- "from_ocr": true
- },
- {
- "index": 27,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 295.33333333333337,
- "r_y0": 554.6666666666666,
- "r_x1": 279.0,
- "r_y1": 554.6666666666666,
- "r_x2": 279.0,
- "r_y2": 563.3333333333334,
- "r_x3": 295.33333333333337,
- "r_y3": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "cell",
- "orig": "cell",
- "text_direction": "left_to_right",
- "confidence": 0.9622145799999999,
- "from_ocr": true
- },
- {
- "index": 28,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 213.66666666666666,
- "r_y0": 554.6666666666666,
- "r_x1": 190.0,
- "r_y1": 554.6666666666666,
- "r_x2": 190.0,
- "r_y2": 563.3333333333334,
- "r_x3": 213.66666666666666,
- "r_y3": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "have",
- "orig": "have",
- "text_direction": "left_to_right",
- "confidence": 0.96403,
- "from_ocr": true
- },
- {
- "index": 29,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 186.0,
- "r_y0": 554.6666666666666,
- "r_x1": 149.0,
- "r_y1": 554.6666666666666,
- "r_x2": 149.0,
- "r_y2": 563.0,
- "r_x3": 186.0,
- "r_y3": 563.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "content",
- "orig": "content",
- "text_direction": "left_to_right",
- "confidence": 0.96691612,
- "from_ocr": true
- },
- {
- "index": 30,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 451.6666666666667,
- "r_y0": 508.3333333333333,
- "r_x1": 422.6666666666667,
- "r_y1": 508.3333333333333,
- "r_x2": 422.6666666666667,
- "r_y2": 517.0,
- "r_x3": 451.6666666666667,
- "r_y3": 517.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "Some",
- "orig": "Some",
- "text_direction": "left_to_right",
- "confidence": 0.9684503200000001,
- "from_ocr": true
- },
- {
- "index": 31,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 419.0,
- "r_y0": 508.3333333333333,
- "r_x1": 393.0,
- "r_y1": 508.3333333333333,
- "r_x2": 393.0,
- "r_y2": 516.6666666666666,
- "r_x3": 419.0,
- "r_y3": 516.6666666666666,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.96073517,
- "from_ocr": true
- },
- {
- "index": 32,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 389.3333333333333,
- "r_y0": 508.3333333333333,
- "r_x1": 371.6666666666667,
- "r_y1": 508.3333333333333,
- "r_x2": 371.6666666666667,
- "r_y2": 514.6666666666666,
- "r_x3": 389.3333333333333,
- "r_y3": 514.6666666666666,
- "coord_origin": "TOPLEFT"
- },
- "text": "row",
- "orig": "row",
- "text_direction": "left_to_right",
- "confidence": 0.9615368700000001,
- "from_ocr": true
- },
- {
- "index": 33,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 329.0,
- "r_y0": 508.3333333333333,
- "r_x1": 303.0,
- "r_y1": 508.3333333333333,
- "r_x2": 303.0,
- "r_y2": 517.0,
- "r_x3": 329.0,
- "r_y3": 517.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.9626261100000001,
- "from_ocr": true
- },
- {
- "index": 34,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 299.66666666666663,
- "r_y0": 508.3333333333333,
- "r_x1": 275.66666666666663,
- "r_y1": 508.3333333333333,
- "r_x2": 275.66666666666663,
- "r_y2": 517.0,
- "r_x3": 299.66666666666663,
- "r_y3": 517.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "don't",
- "orig": "don't",
- "text_direction": "left_to_right",
- "confidence": 0.96669136,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": [
- {
- "id": 7,
- "label": "text",
- "bbox": {
- "l": 268.33333333333337,
- "t": 601.0,
- "r": 337.0,
- "b": 609.6666666666666,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.7441245913505554,
- "cells": [
- {
- "index": 19,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 337.0,
- "r_y0": 601.0,
- "r_x1": 308.0,
- "r_y1": 601.0,
- "r_x2": 308.0,
- "r_y2": 609.6666666666666,
- "r_x3": 337.0,
- "r_y3": 609.6666666666666,
- "coord_origin": "TOPLEFT"
- },
- "text": "Some",
- "orig": "Some",
- "text_direction": "left_to_right",
- "confidence": 0.95841644,
- "from_ocr": true
- },
- {
- "index": 20,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 304.0,
- "r_y0": 601.0,
- "r_x1": 268.33333333333337,
- "r_y1": 601.0,
- "r_x2": 268.33333333333337,
- "r_y2": 609.3333333333334,
- "r_x3": 304.0,
- "r_y3": 609.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "column",
- "orig": "column",
- "text_direction": "left_to_right",
- "confidence": 0.95624527,
- "from_ocr": true
- }
- ],
- "children": []
- },
{
"id": 1,
"label": "text",
"bbox": {
- "l": 133.0,
- "t": 601.0,
- "r": 230.66666666666666,
- "b": 609.6666666666666,
+ "l": 602.0,
+ "t": 485.66666666666663,
+ "r": 694.6666666666666,
+ "b": 506.3333333333333,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7668525576591492,
+ "confidence": 90.0,
"cells": [
{
- "index": 21,
+ "index": 0,
"rgba": {
"r": 0,
"g": 0,
@@ -6079,135 +4481,20 @@
"a": 255
},
"rect": {
- "r_x0": 230.66666666666666,
- "r_y0": 601.0,
- "r_x1": 201.66666666666669,
- "r_y1": 601.0,
- "r_x2": 201.66666666666669,
- "r_y2": 609.6666666666666,
- "r_x3": 230.66666666666666,
- "r_y3": 609.6666666666666,
+ "r_x0": 694.6666666666666,
+ "r_y0": 485.66666666666663,
+ "r_x1": 602.0,
+ "r_y1": 485.66666666666663,
+ "r_x2": 602.0,
+ "r_y2": 506.3333333333333,
+ "r_x3": 694.6666666666666,
+ "r_y3": 506.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 0.96296555,
- "from_ocr": true
- },
- {
- "index": 22,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 197.66666666666669,
- "r_y0": 601.0,
- "r_x1": 172.0,
- "r_y1": 601.0,
- "r_x2": 172.0,
- "r_y2": 609.3333333333334,
- "r_x3": 197.66666666666669,
- "r_y3": 609.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.96467484,
- "from_ocr": true
- },
- {
- "index": 23,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 168.66666666666669,
- "r_y0": 601.0,
- "r_x1": 133.0,
- "r_y1": 601.0,
- "r_x2": 133.0,
- "r_y2": 609.3333333333334,
- "r_x3": 168.66666666666669,
- "r_y3": 609.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "column",
- "orig": "column",
- "text_direction": "left_to_right",
- "confidence": 0.95497986,
- "from_ocr": true
- }
- ],
- "children": []
- },
- {
- "id": 4,
- "label": "text",
- "bbox": {
- "l": 386.3333333333333,
- "t": 554.6666666666666,
- "r": 437.3333333333333,
- "b": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.7588309049606323,
- "cells": [
- {
- "index": 24,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 437.3333333333333,
- "r_y0": 554.6666666666666,
- "r_x1": 408.3333333333333,
- "r_y1": 554.6666666666666,
- "r_x2": 408.3333333333333,
- "r_y2": 563.3333333333334,
- "r_x3": 437.3333333333333,
- "r_y3": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "Some",
- "orig": "Some",
- "text_direction": "left_to_right",
- "confidence": 0.95944489,
- "from_ocr": true
- },
- {
- "index": 25,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 404.0,
- "r_y0": 554.6666666666666,
- "r_x1": 386.3333333333333,
- "r_y1": 554.6666666666666,
- "r_x2": 386.3333333333333,
- "r_y2": 561.0,
- "r_x3": 404.0,
- "r_y3": 561.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "row",
- "orig": "row",
- "text_direction": "left_to_right",
- "confidence": 0.9680950199999999,
+ "confidence": 90.0,
"from_ocr": true
}
],
@@ -6217,16 +4504,16 @@
"id": 2,
"label": "text",
"bbox": {
- "l": 279.0,
- "t": 554.6666666666666,
- "r": 326.33333333333337,
- "b": 563.3333333333334,
+ "l": 610.0,
+ "t": 454.33333333333337,
+ "r": 680.0,
+ "b": 475.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7627862095832825,
+ "confidence": 90.0,
"cells": [
{
- "index": 26,
+ "index": 1,
"rgba": {
"r": 0,
"g": 0,
@@ -6234,110 +4521,20 @@
"a": 255
},
"rect": {
- "r_x0": 326.33333333333337,
- "r_y0": 554.6666666666666,
- "r_x1": 299.0,
- "r_y1": 554.6666666666666,
- "r_x2": 299.0,
- "r_y2": 561.0,
- "r_x3": 326.33333333333337,
- "r_y3": 561.0,
+ "r_x0": 680.0,
+ "r_y0": 454.33333333333337,
+ "r_x1": 610.0,
+ "r_y1": 454.33333333333337,
+ "r_x2": 610.0,
+ "r_y2": 475.0,
+ "r_x3": 680.0,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "some",
- "orig": "some",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 0.9569136,
- "from_ocr": true
- },
- {
- "index": 27,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 295.33333333333337,
- "r_y0": 554.6666666666666,
- "r_x1": 279.0,
- "r_y1": 554.6666666666666,
- "r_x2": 279.0,
- "r_y2": 563.3333333333334,
- "r_x3": 295.33333333333337,
- "r_y3": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "cell",
- "orig": "cell",
- "text_direction": "left_to_right",
- "confidence": 0.9622145799999999,
- "from_ocr": true
- }
- ],
- "children": []
- },
- {
- "id": 5,
- "label": "text",
- "bbox": {
- "l": 149.0,
- "t": 554.6666666666666,
- "r": 213.66666666666666,
- "b": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.7541249394416809,
- "cells": [
- {
- "index": 28,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 213.66666666666666,
- "r_y0": 554.6666666666666,
- "r_x1": 190.0,
- "r_y1": 554.6666666666666,
- "r_x2": 190.0,
- "r_y2": 563.3333333333334,
- "r_x3": 213.66666666666666,
- "r_y3": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "text": "have",
- "orig": "have",
- "text_direction": "left_to_right",
- "confidence": 0.96403,
- "from_ocr": true
- },
- {
- "index": 29,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 186.0,
- "r_y0": 554.6666666666666,
- "r_x1": 149.0,
- "r_y1": 554.6666666666666,
- "r_x2": 149.0,
- "r_y2": 563.0,
- "r_x3": 186.0,
- "r_y3": 563.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "content",
- "orig": "content",
- "text_direction": "left_to_right",
- "confidence": 0.96691612,
+ "confidence": 90.0,
"from_ocr": true
}
],
@@ -6347,16 +4544,16 @@
"id": 3,
"label": "text",
"bbox": {
- "l": 371.6666666666667,
- "t": 508.3333333333333,
- "r": 451.6666666666667,
- "b": 517.0,
+ "l": 623.3333333333334,
+ "t": 392.0,
+ "r": 670.3333333333334,
+ "b": 408.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7616423964500427,
+ "confidence": 96.0,
"cells": [
{
- "index": 30,
+ "index": 2,
"rgba": {
"r": 0,
"g": 0,
@@ -6364,24 +4561,39 @@
"a": 255
},
"rect": {
- "r_x0": 451.6666666666667,
- "r_y0": 508.3333333333333,
- "r_x1": 422.6666666666667,
- "r_y1": 508.3333333333333,
- "r_x2": 422.6666666666667,
- "r_y2": 517.0,
- "r_x3": 451.6666666666667,
- "r_y3": 517.0,
+ "r_x0": 670.3333333333334,
+ "r_y0": 392.0,
+ "r_x1": 623.3333333333334,
+ "r_y1": 392.0,
+ "r_x2": 623.3333333333334,
+ "r_y2": 408.0,
+ "r_x3": 670.3333333333334,
+ "r_y3": 408.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9684503200000001,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 4,
+ "label": "text",
+ "bbox": {
+ "l": 623.3333333333334,
+ "t": 312.0,
+ "r": 670.3333333333334,
+ "b": 328.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
{
- "index": 31,
+ "index": 3,
"rgba": {
"r": 0,
"g": 0,
@@ -6389,24 +4601,39 @@
"a": 255
},
"rect": {
- "r_x0": 419.0,
- "r_y0": 508.3333333333333,
- "r_x1": 393.0,
- "r_y1": 508.3333333333333,
- "r_x2": 393.0,
- "r_y2": 516.6666666666666,
- "r_x3": 419.0,
- "r_y3": 516.6666666666666,
+ "r_x0": 670.3333333333334,
+ "r_y0": 312.0,
+ "r_x1": 623.3333333333334,
+ "r_y1": 312.0,
+ "r_x2": 623.3333333333334,
+ "r_y2": 328.0,
+ "r_x3": 670.3333333333334,
+ "r_y3": 328.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96073517,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 5,
+ "label": "text",
+ "bbox": {
+ "l": 428.3333333333333,
+ "t": 485.66666666666663,
+ "r": 559.6666666666667,
+ "b": 506.3333333333333,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 92.0,
+ "cells": [
{
- "index": 32,
+ "index": 4,
"rgba": {
"r": 0,
"g": 0,
@@ -6414,20 +4641,20 @@
"a": 255
},
"rect": {
- "r_x0": 389.3333333333333,
- "r_y0": 508.3333333333333,
- "r_x1": 371.6666666666667,
- "r_y1": 508.3333333333333,
- "r_x2": 371.6666666666667,
- "r_y2": 514.6666666666666,
- "r_x3": 389.3333333333333,
- "r_y3": 514.6666666666666,
+ "r_x0": 559.6666666666667,
+ "r_y0": 485.66666666666663,
+ "r_x1": 428.3333333333333,
+ "r_y1": 485.66666666666663,
+ "r_x2": 428.3333333333333,
+ "r_y2": 506.3333333333333,
+ "r_x3": 559.6666666666667,
+ "r_y3": 506.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 0.9615368700000001,
+ "confidence": 92.0,
"from_ocr": true
}
],
@@ -6437,16 +4664,16 @@
"id": 6,
"label": "text",
"bbox": {
- "l": 275.66666666666663,
- "t": 508.3333333333333,
- "r": 329.0,
- "b": 517.0,
+ "l": 456.0,
+ "t": 459.0,
+ "r": 526.6666666666667,
+ "b": 475.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7468306422233582,
+ "confidence": 94.0,
"cells": [
{
- "index": 33,
+ "index": 5,
"rgba": {
"r": 0,
"g": 0,
@@ -6454,24 +4681,39 @@
"a": 255
},
"rect": {
- "r_x0": 329.0,
- "r_y0": 508.3333333333333,
- "r_x1": 303.0,
- "r_y1": 508.3333333333333,
- "r_x2": 303.0,
- "r_y2": 517.0,
- "r_x3": 329.0,
- "r_y3": 517.0,
+ "r_x0": 526.6666666666667,
+ "r_y0": 459.0,
+ "r_x1": 456.0,
+ "r_y1": 459.0,
+ "r_x2": 456.0,
+ "r_y2": 475.0,
+ "r_x3": 526.6666666666667,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9626261100000001,
+ "confidence": 94.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 7,
+ "label": "text",
+ "bbox": {
+ "l": 442.3333333333333,
+ "t": 408.0,
+ "r": 545.0,
+ "b": 424.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 91.0,
+ "cells": [
{
- "index": 34,
+ "index": 6,
"rgba": {
"r": 0,
"g": 0,
@@ -6479,20 +4721,380 @@
"a": 255
},
"rect": {
- "r_x0": 299.66666666666663,
- "r_y0": 508.3333333333333,
- "r_x1": 275.66666666666663,
- "r_y1": 508.3333333333333,
- "r_x2": 275.66666666666663,
- "r_y2": 517.0,
- "r_x3": 299.66666666666663,
- "r_y3": 517.0,
+ "r_x0": 545.0,
+ "r_y0": 408.0,
+ "r_x1": 442.3333333333333,
+ "r_y1": 408.0,
+ "r_x2": 442.3333333333333,
+ "r_y2": 424.0,
+ "r_x3": 545.0,
+ "r_y3": 424.0,
"coord_origin": "TOPLEFT"
},
- "text": "don't",
- "orig": "don't",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.96669136,
+ "confidence": 91.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 8,
+ "label": "text",
+ "bbox": {
+ "l": 468.0,
+ "t": 376.0,
+ "r": 515.0,
+ "b": 392.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
+ {
+ "index": 7,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 515.0,
+ "r_y0": 376.0,
+ "r_x1": 468.0,
+ "r_y1": 376.0,
+ "r_x2": 468.0,
+ "r_y2": 392.0,
+ "r_x3": 515.0,
+ "r_y3": 392.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 9,
+ "label": "text",
+ "bbox": {
+ "l": 442.3333333333333,
+ "t": 328.0,
+ "r": 545.0,
+ "b": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
+ {
+ "index": 8,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 545.0,
+ "r_y0": 328.0,
+ "r_x1": 442.3333333333333,
+ "r_y1": 328.0,
+ "r_x2": 442.3333333333333,
+ "r_y2": 344.0,
+ "r_x3": 545.0,
+ "r_y3": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Some other",
+ "orig": "Some other",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 10,
+ "label": "text",
+ "bbox": {
+ "l": 468.0,
+ "t": 296.6666666666667,
+ "r": 515.0,
+ "b": 312.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 9,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 515.0,
+ "r_y0": 296.6666666666667,
+ "r_x1": 468.0,
+ "r_y1": 296.6666666666667,
+ "r_x2": 468.0,
+ "r_y2": 312.6666666666667,
+ "r_x3": 515.0,
+ "r_y3": 312.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 11,
+ "label": "text",
+ "bbox": {
+ "l": 274.0,
+ "t": 490.33333333333337,
+ "r": 385.6666666666667,
+ "b": 506.3333333333333,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 10,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 385.6666666666667,
+ "r_y0": 490.33333333333337,
+ "r_x1": 274.0,
+ "r_y1": 490.33333333333337,
+ "r_x2": 274.0,
+ "r_y2": 506.3333333333333,
+ "r_x3": 385.6666666666667,
+ "r_y3": 506.3333333333333,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 12,
+ "label": "text",
+ "bbox": {
+ "l": 292.66666666666663,
+ "t": 459.0,
+ "r": 363.0,
+ "b": 475.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
+ {
+ "index": 11,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 363.0,
+ "r_y0": 459.0,
+ "r_x1": 292.66666666666663,
+ "r_y1": 459.0,
+ "r_x2": 292.66666666666663,
+ "r_y2": 475.0,
+ "r_x3": 363.0,
+ "r_y3": 475.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "column",
+ "orig": "column",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 13,
+ "label": "text",
+ "bbox": {
+ "l": 278.0,
+ "t": 408.0,
+ "r": 383.6666666666667,
+ "b": 424.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
+ {
+ "index": 12,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 383.6666666666667,
+ "r_y0": 408.0,
+ "r_x1": 278.0,
+ "r_y1": 408.0,
+ "r_x2": 278.0,
+ "r_y2": 424.0,
+ "r_x3": 383.6666666666667,
+ "r_y3": 424.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 14,
+ "label": "text",
+ "bbox": {
+ "l": 304.33333333333337,
+ "t": 376.0,
+ "r": 351.33333333333337,
+ "b": 392.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 351.33333333333337,
+ "r_y0": 376.0,
+ "r_x1": 304.33333333333337,
+ "r_y1": 376.0,
+ "r_x2": 304.33333333333337,
+ "r_y2": 392.0,
+ "r_x3": 351.33333333333337,
+ "r_y3": 392.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 15,
+ "label": "text",
+ "bbox": {
+ "l": 278.0,
+ "t": 328.0,
+ "r": 383.6666666666667,
+ "b": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 383.6666666666667,
+ "r_y0": 328.0,
+ "r_x1": 278.0,
+ "r_y1": 328.0,
+ "r_x2": 278.0,
+ "r_y2": 344.0,
+ "r_x3": 383.6666666666667,
+ "r_y3": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 16,
+ "label": "text",
+ "bbox": {
+ "l": 304.33333333333337,
+ "t": 296.6666666666667,
+ "r": 351.33333333333337,
+ "b": 312.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 351.33333333333337,
+ "r_y0": 296.6666666666667,
+ "r_x1": 304.33333333333337,
+ "r_y1": 296.6666666666667,
+ "r_x2": 304.33333333333337,
+ "r_y2": 312.6666666666667,
+ "r_x3": 351.33333333333337,
+ "r_y3": 312.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
"from_ocr": true
}
],
@@ -6502,17 +5104,17 @@
},
"text": null,
"otsl_seq": [
- "ecel",
+ "ched",
"ched",
"ched",
"nl",
- "rhed",
+ "fcel",
"fcel",
"fcel",
"nl",
- "rhed",
"fcel",
- "ecel",
+ "fcel",
+ "fcel",
"nl"
],
"num_rows": 3,
@@ -6520,29 +5122,48 @@
"table_cells": [
{
"bbox": {
- "l": 308.0,
- "t": 601.0,
- "r": 337.0,
- "b": 609.6666666666666,
+ "l": 97.33333333333337,
+ "t": 105.66666666666669,
+ "r": 190.0,
+ "b": 126.33333333333337,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
"col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "Some column",
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 0,
+ "end_col_offset_idx": 1,
+ "text": "Vertically merged",
+ "column_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 121.66666666666663,
+ "t": 204.0,
+ "r": 168.66666666666663,
+ "b": 220.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 0,
+ "end_col_offset_idx": 1,
+ "text": "value",
"column_header": false,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 201.66666666666669,
- "t": 601.0,
- "r": 230.66666666666666,
- "b": 609.6666666666666,
+ "l": 121.66666666666663,
+ "t": 284.0,
+ "r": 168.66666666666663,
+ "b": 300.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -6551,17 +5172,93 @@
"end_row_offset_idx": 3,
"start_col_offset_idx": 0,
"end_col_offset_idx": 1,
- "text": "Some other column",
+ "text": "value",
"column_header": false,
- "row_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 232.33333333333326,
+ "t": 105.66666666666669,
+ "r": 363.6666666666667,
+ "b": 126.33333333333337,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Other merged column",
+ "column_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 247.0,
+ "t": 188.0,
+ "r": 349.6666666666667,
+ "b": 204.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Some other value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 247.0,
+ "t": 268.0,
+ "r": 349.6666666666667,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 2,
+ "end_row_offset_idx": 3,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Some other value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 406.3333333333333,
+ "t": 105.66666666666669,
+ "r": 518.0,
+ "b": 121.66666666666663,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another column",
+ "column_header": true,
+ "row_header": false,
"row_section": false
},
{
"bbox": {
"l": 408.3333333333333,
- "t": 554.6666666666666,
- "r": 437.3333333333333,
- "b": 563.3333333333334,
+ "t": 188.0,
+ "r": 514.0,
+ "b": 204.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -6570,84 +5267,27 @@
"end_row_offset_idx": 2,
"start_col_offset_idx": 2,
"end_col_offset_idx": 3,
- "text": "Some row",
+ "text": "Yet another value",
"column_header": false,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 299.0,
- "t": 554.6666666666666,
- "r": 326.33333333333337,
- "b": 561.0,
+ "l": 408.3333333333333,
+ "t": 268.0,
+ "r": 514.0,
+ "b": 284.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
"col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "some cell",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 190.0,
- "t": 554.6666666666666,
- "r": 213.66666666666666,
- "b": 563.3333333333334,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "have content",
- "column_header": false,
- "row_header": true,
- "row_section": false
- },
- {
- "bbox": {
- "l": 422.6666666666667,
- "t": 508.3333333333333,
- "r": 451.6666666666667,
- "b": 517.0,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
+ "start_row_offset_idx": 2,
+ "end_row_offset_idx": 3,
"start_col_offset_idx": 2,
"end_col_offset_idx": 3,
- "text": "Some other row",
- "column_header": true,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 303.0,
- "t": 508.3333333333333,
- "r": 329.0,
- "b": 517.0,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "other don't",
- "column_header": true,
+ "text": "Yet another value",
+ "column_header": false,
"row_header": false,
"row_section": false
}
diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_270.doctags.txt b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_270.doctags.txt
index 7ba27bf2..8afe2766 100644
--- a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_270.doctags.txt
+++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_270.doctags.txt
@@ -1,9 +1,6 @@
-
-and last row 2and row 1this is row 0
-nothingsome cellsColumn 0
-otherhave contentColumn 1
-insidehaveandColumn 2
+
+Yet another valueSome other valuevalue
\ No newline at end of file
diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_270.json b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_270.json
index 0594cfe0..070a848c 100644
--- a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_270.json
+++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_270.json
@@ -27,13 +27,13 @@
"file-info": {
"filename": "ocr_test_rotated_270.pdf",
"filename-prov": null,
- "document-hash": "6fefac7b5b41551979e0acb695ca99549a91784619c82c6095d8130179431437",
+ "document-hash": "753140dc9b8c39b67c6f6712e2a1de4c364c808ca09d13dd05b79c23192429dc",
"#-pages": 1,
"collection-name": null,
"description": null,
"page-hashes": [
{
- "hash": "68730d83582a6ac50587fdba1a8ce6b263d682a0daf984522d4dbe9f9e3d4fbe",
+ "hash": "c8fa256d58940f76c5e0ec6b65548a2e939f867c2c75d0ee27f5f70ff32a44be",
"model": "default",
"page": 1
}
@@ -44,92 +44,18 @@
"name": "Table",
"type": "table",
"$ref": "#/tables/0"
- },
- {
- "prov": [
- {
- "bbox": [
- 640.87671,
- 235.72681,
- 653.16504,
- 533.28552
- ],
- "page": 1,
- "span": [
- 0,
- 49
- ],
- "__ref_s3_data": null
- }
- ],
- "text": "heteststartswithsomerandomtextandthenatableimage:",
- "type": "paragraph",
- "payload": null,
- "name": "Text",
- "font": null
- },
- {
- "name": "Picture",
- "type": "figure",
- "$ref": "#/figures/0"
- },
- {
- "prov": [
- {
- "bbox": [
- 690.10272,
- 194.03976,
- 719.1490499999999,
- 410.73663
- ],
- "page": 1,
- "span": [
- 0,
- 20
- ],
- "__ref_s3_data": null
- }
- ],
- "text": "This is a table test",
- "type": "subtitle-level-1",
- "payload": null,
- "name": "Section-header",
- "font": null
- }
- ],
- "figures": [
- {
- "prov": [
- {
- "bbox": [
- 668.9778442382812,
- 532.5339431762695,
- 683.4164962768555,
- 541.4290084838867
- ],
- "page": 1,
- "span": [
- 0,
- 0
- ],
- "__ref_s3_data": null
- }
- ],
- "text": "",
- "type": "figure",
- "payload": null,
- "bounding-box": null
}
],
+ "figures": [],
"tables": [
{
"prov": [
{
"bbox": [
- 460.5577697753906,
- 112.21743774414062,
- 599.0364074707031,
- 469.385986328125
+ 277.4178771972656,
+ 240.90216064453125,
+ 524.3541717529297,
+ 722.9614028930664
],
"page": 1,
"span": [
@@ -142,9 +68,96 @@
"text": "",
"type": "table",
"payload": null,
- "#-cols": 0,
- "#-rows": 0,
- "data": [],
+ "#-cols": 3,
+ "#-rows": 1,
+ "data": [
+ [
+ {
+ "bbox": [
+ 98.0,
+ 296.6666666666667,
+ 203.66666666666669,
+ 344.0
+ ],
+ "spans": [
+ [
+ 0,
+ 0
+ ]
+ ],
+ "text": "Yet another value",
+ "type": "body",
+ "col": 0,
+ "col-header": false,
+ "col-span": [
+ 0,
+ 1
+ ],
+ "row": 0,
+ "row-header": false,
+ "row-span": [
+ 0,
+ 1
+ ]
+ },
+ {
+ "bbox": [
+ 262.3333333333333,
+ 296.6666666666667,
+ 365.0,
+ 344.0
+ ],
+ "spans": [
+ [
+ 0,
+ 1
+ ]
+ ],
+ "text": "Some other value",
+ "type": "body",
+ "col": 1,
+ "col-header": false,
+ "col-span": [
+ 1,
+ 2
+ ],
+ "row": 0,
+ "row-header": false,
+ "row-span": [
+ 0,
+ 1
+ ]
+ },
+ {
+ "bbox": [
+ 443.33333333333337,
+ 312.0,
+ 490.33333333333337,
+ 328.0
+ ],
+ "spans": [
+ [
+ 0,
+ 2
+ ]
+ ],
+ "text": "value",
+ "type": "body",
+ "col": 2,
+ "col-header": false,
+ "col-span": [
+ 2,
+ 3
+ ],
+ "row": 0,
+ "row-header": false,
+ "row-span": [
+ 0,
+ 1
+ ]
+ }
+ ]
+ ],
"model": null,
"bounding-box": null
}
@@ -154,9 +167,9 @@
"footnotes": [],
"page-dimensions": [
{
- "height": 612.0,
+ "height": 792.0,
"page": 1,
- "width": 792.0
+ "width": 612.0
}
],
"page-footers": [],
diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_270.md b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_270.md
index f423a6c2..e69de29b 100644
--- a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_270.md
+++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_270.md
@@ -1,5 +0,0 @@
-| and last row 2 | and row 1 | this is row 0 | |
-|------------------|-------------|-----------------|----------|
-| nothing | | some cells | Column 0 |
-| | other | have content | Column 1 |
-| inside | have | and | Column 2 |
\ No newline at end of file
diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_270.pages.json b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_270.pages.json
index 87a75a66..3638ffc4 100644
--- a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_270.pages.json
+++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_270.pages.json
@@ -2,8 +2,8 @@
{
"page_no": 0,
"size": {
- "width": 792.0,
- "height": 612.0
+ "width": 612.0,
+ "height": 792.0
},
"parsed_page": {
"dimension": {
@@ -11,47 +11,47 @@
"rect": {
"r_x0": 0.0,
"r_y0": 0.0,
- "r_x1": 612.0,
+ "r_x1": 792.0,
"r_y1": 0.0,
- "r_x2": 612.0,
- "r_y2": 792.0,
+ "r_x2": 792.0,
+ "r_y2": 612.0,
"r_x3": 0.0,
- "r_y3": 792.0,
+ "r_y3": 612.0,
"coord_origin": "BOTTOMLEFT"
},
"boundary_type": "crop_box",
"art_bbox": {
"l": 0.0,
- "t": 792.0,
- "r": 612.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
},
"bleed_bbox": {
"l": 0.0,
- "t": 792.0,
- "r": 612.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
},
"crop_bbox": {
"l": 0.0,
- "t": 792.0,
- "r": 612.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
},
"media_bbox": {
"l": 0.0,
- "t": 792.0,
- "r": 612.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
},
"trim_bbox": {
"l": 0.0,
- "t": 792.0,
- "r": 612.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
}
@@ -69,21 +69,21 @@
"a": 255
},
"rect": {
- "r_x0": 690.10272,
- "r_y0": 417.96024,
- "r_x1": 719.1490499999999,
- "r_y1": 417.96024,
- "r_x2": 719.1490499999999,
- "r_y2": 201.26337,
- "r_x3": 690.10272,
- "r_y3": 201.26337,
+ "r_x0": 485.66666666666663,
+ "r_y0": 97.33333333333333,
+ "r_x1": 485.66666666666663,
+ "r_y1": 190.0,
+ "r_x2": 506.3333333333333,
+ "r_y2": 190.0,
+ "r_x3": 506.3333333333333,
+ "r_y3": 97.33333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "This is a table test ",
- "orig": "This is a table test ",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 89.0,
+ "from_ocr": true
},
{
"index": 1,
@@ -94,21 +94,21 @@
"a": 255
},
"rect": {
- "r_x0": 669.96899,
- "r_y0": 78.71936000000005,
- "r_x1": 682.25806,
- "r_y1": 78.71936000000005,
- "r_x2": 682.25806,
- "r_y2": 71.99987999999996,
- "r_x3": 669.96899,
- "r_y3": 71.99987999999996,
+ "r_x0": 454.33333333333337,
+ "r_y0": 112.0,
+ "r_x1": 454.33333333333337,
+ "r_y1": 182.33333333333334,
+ "r_x2": 475.0,
+ "r_y2": 182.33333333333334,
+ "r_x3": 475.0,
+ "r_y3": 112.0,
"coord_origin": "TOPLEFT"
},
- "text": " T",
- "orig": " T",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 2,
@@ -119,21 +119,21 @@
"a": 255
},
"rect": {
- "r_x0": 640.87671,
- "r_y0": 376.27319,
- "r_x1": 653.16504,
- "r_y1": 376.27319,
- "r_x2": 653.16504,
- "r_y2": 78.71447999999998,
- "r_x3": 640.87671,
- "r_y3": 78.71447999999998,
+ "r_x0": 392.0,
+ "r_y0": 121.66666666666667,
+ "r_x1": 392.0,
+ "r_y1": 168.66666666666666,
+ "r_x2": 408.0,
+ "r_y2": 168.66666666666666,
+ "r_x3": 408.0,
+ "r_y3": 121.66666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "heteststartswithsomerandomtextandthenatableimage: ",
- "orig": "heteststartswithsomerandomtextandthenatableimage: ",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 3,
@@ -144,21 +144,21 @@
"a": 255
},
"rect": {
- "r_x0": 408.21301,
- "r_y0": 309.05624,
- "r_x1": 420.50208,
- "r_y1": 309.05624,
- "r_x2": 420.50208,
- "r_y2": 306.0,
- "r_x3": 408.21301,
- "r_y3": 306.0,
+ "r_x0": 312.0,
+ "r_y0": 121.66666666666667,
+ "r_x1": 312.0,
+ "r_y1": 168.66666666666666,
+ "r_x2": 328.0,
+ "r_y2": 168.66666666666666,
+ "r_x3": 328.0,
+ "r_y3": 121.66666666666667,
"coord_origin": "TOPLEFT"
},
- "text": " ",
- "orig": " ",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 4,
@@ -169,20 +169,20 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 275.0,
- "r_x1": 572.0,
- "r_y1": 304.0,
- "r_x2": 580.6666666666666,
- "r_y2": 304.0,
- "r_x3": 580.6666666666666,
- "r_y3": 275.0,
+ "r_x0": 485.66666666666663,
+ "r_y0": 232.66666666666666,
+ "r_x1": 485.66666666666663,
+ "r_y1": 364.0,
+ "r_x2": 506.3333333333333,
+ "r_y2": 364.0,
+ "r_x3": 506.3333333333333,
+ "r_y3": 232.66666666666666,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 0.95741158,
+ "confidence": 92.0,
"from_ocr": true
},
{
@@ -194,20 +194,20 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 308.0,
- "r_x1": 572.0,
- "r_y1": 343.66666666666663,
- "r_x2": 580.3333333333334,
- "r_y2": 343.66666666666663,
- "r_x3": 580.3333333333334,
- "r_y3": 308.0,
+ "r_x0": 459.0,
+ "r_y0": 265.66666666666663,
+ "r_x1": 459.0,
+ "r_y1": 336.0,
+ "r_x2": 475.0,
+ "r_y2": 336.0,
+ "r_x3": 475.0,
+ "r_y3": 265.66666666666663,
"coord_origin": "TOPLEFT"
},
"text": "column",
"orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9541709899999999,
+ "confidence": 94.0,
"from_ocr": true
},
{
@@ -219,20 +219,20 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 381.3333333333333,
- "r_x1": 572.0,
- "r_y1": 410.3333333333333,
- "r_x2": 580.6666666666666,
- "r_y2": 410.3333333333333,
- "r_x3": 580.6666666666666,
- "r_y3": 381.3333333333333,
+ "r_x0": 408.0,
+ "r_y0": 247.0,
+ "r_x1": 408.0,
+ "r_y1": 349.6666666666667,
+ "r_x2": 424.0,
+ "r_y2": 349.6666666666667,
+ "r_x3": 424.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.96515053,
+ "confidence": 89.0,
"from_ocr": true
},
{
@@ -244,20 +244,20 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 414.3333333333333,
- "r_x1": 572.0,
- "r_y1": 440.3333333333333,
- "r_x2": 580.3333333333334,
- "r_y2": 440.3333333333333,
- "r_x3": 580.3333333333334,
- "r_y3": 414.3333333333333,
+ "r_x0": 376.0,
+ "r_y0": 277.0,
+ "r_x1": 376.0,
+ "r_y1": 324.3333333333333,
+ "r_x2": 392.0,
+ "r_y2": 324.3333333333333,
+ "r_x3": 392.0,
+ "r_y3": 277.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9623101,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -269,20 +269,20 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 443.3333333333333,
- "r_x1": 572.0,
- "r_y1": 479.3333333333333,
- "r_x2": 580.3333333333334,
- "r_y2": 479.3333333333333,
- "r_x3": 580.3333333333334,
- "r_y3": 443.3333333333333,
+ "r_x0": 328.0,
+ "r_y0": 247.0,
+ "r_x1": 328.0,
+ "r_y1": 349.6666666666667,
+ "r_x2": 344.0,
+ "r_y2": 349.6666666666667,
+ "r_x3": 344.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.94704376,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -294,20 +294,20 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 175.0,
- "r_x1": 525.6666666666666,
- "r_y1": 204.0,
- "r_x2": 534.3333333333334,
- "r_y2": 204.0,
- "r_x3": 534.3333333333334,
- "r_y3": 175.0,
+ "r_x0": 296.6666666666667,
+ "r_y0": 277.33333333333337,
+ "r_x1": 296.6666666666667,
+ "r_y1": 324.3333333333333,
+ "r_x2": 312.6666666666667,
+ "r_y2": 324.3333333333333,
+ "r_x3": 312.6666666666667,
+ "r_y3": 277.33333333333337,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96139633,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -319,20 +319,20 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 208.0,
- "r_x1": 525.6666666666666,
- "r_y1": 225.66666666666669,
- "r_x2": 532.0,
- "r_y2": 225.66666666666669,
- "r_x3": 532.0,
- "r_y3": 208.0,
+ "r_x0": 490.33333333333337,
+ "r_y0": 406.3333333333333,
+ "r_x1": 490.33333333333337,
+ "r_y1": 518.3333333333333,
+ "r_x2": 506.3333333333333,
+ "r_y2": 518.3333333333333,
+ "r_x3": 506.3333333333333,
+ "r_y3": 406.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.9561322,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -344,20 +344,20 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 285.66666666666663,
- "r_x1": 525.6666666666666,
- "r_y1": 313.0,
- "r_x2": 532.0,
- "r_y2": 313.0,
- "r_x3": 532.0,
- "r_y3": 285.66666666666663,
+ "r_x0": 459.0,
+ "r_y0": 429.3333333333333,
+ "r_x1": 459.0,
+ "r_y1": 499.3333333333333,
+ "r_x2": 475.0,
+ "r_y2": 499.3333333333333,
+ "r_x3": 475.0,
+ "r_y3": 429.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "some",
- "orig": "some",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9615657,
+ "confidence": 94.0,
"from_ocr": true
},
{
@@ -369,20 +369,20 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 317.0,
- "r_x1": 525.6666666666666,
- "r_y1": 333.0,
- "r_x2": 534.3333333333334,
- "r_y2": 333.0,
- "r_x3": 534.3333333333334,
- "r_y3": 317.0,
+ "r_x0": 408.0,
+ "r_y0": 408.3333333333333,
+ "r_x1": 408.0,
+ "r_y1": 514.0,
+ "r_x2": 424.0,
+ "r_y2": 514.0,
+ "r_x3": 424.0,
+ "r_y3": 408.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "cell",
- "orig": "cell",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.95838455,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -394,20 +394,20 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 398.3333333333333,
- "r_x1": 525.6666666666666,
- "r_y1": 422.0,
- "r_x2": 534.3333333333334,
- "r_y2": 422.0,
- "r_x3": 534.3333333333334,
- "r_y3": 398.3333333333333,
+ "r_x0": 376.0,
+ "r_y0": 440.6666666666667,
+ "r_x1": 376.0,
+ "r_y1": 487.6666666666667,
+ "r_x2": 392.0,
+ "r_y2": 487.6666666666667,
+ "r_x3": 392.0,
+ "r_y3": 440.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9642998500000001,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -419,20 +419,20 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 426.0,
- "r_x1": 525.6666666666666,
- "r_y1": 463.0,
- "r_x2": 534.0,
- "r_y2": 463.0,
- "r_x3": 534.0,
- "r_y3": 426.0,
+ "r_x0": 328.0,
+ "r_y0": 408.3333333333333,
+ "r_x1": 328.0,
+ "r_y1": 514.0,
+ "r_x2": 344.0,
+ "r_y2": 514.0,
+ "r_x3": 344.0,
+ "r_y3": 408.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "content",
- "orig": "content",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.96576363,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -444,120 +444,20 @@
"a": 255
},
"rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 160.33333333333334,
- "r_x1": 479.3333333333333,
- "r_y1": 189.33333333333331,
- "r_x2": 488.0,
- "r_y2": 189.33333333333331,
- "r_x3": 488.0,
- "r_y3": 160.33333333333334,
+ "r_x0": 296.6666666666667,
+ "r_y0": 440.6666666666667,
+ "r_x1": 296.6666666666667,
+ "r_y1": 487.6666666666667,
+ "r_x2": 312.6666666666667,
+ "r_y2": 487.6666666666667,
+ "r_x3": 312.6666666666667,
+ "r_y3": 440.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96371613,
- "from_ocr": true
- },
- {
- "index": 16,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 193.33333333333331,
- "r_x1": 479.3333333333333,
- "r_y1": 219.0,
- "r_x2": 488.0,
- "r_y2": 219.0,
- "r_x3": 488.0,
- "r_y3": 193.33333333333331,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.9634315499999999,
- "from_ocr": true
- },
- {
- "index": 17,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 222.66666666666669,
- "r_x1": 479.3333333333333,
- "r_y1": 240.33333333333331,
- "r_x2": 485.6666666666667,
- "r_y2": 240.33333333333331,
- "r_x3": 485.6666666666667,
- "r_y3": 222.66666666666669,
- "coord_origin": "TOPLEFT"
- },
- "text": "row",
- "orig": "row",
- "text_direction": "left_to_right",
- "confidence": 0.9611644699999999,
- "from_ocr": true
- },
- {
- "index": 18,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 283.0,
- "r_x1": 479.3333333333333,
- "r_y1": 309.0,
- "r_x2": 487.6666666666667,
- "r_y2": 309.0,
- "r_x3": 487.6666666666667,
- "r_y3": 283.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.95751617,
- "from_ocr": true
- },
- {
- "index": 19,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 312.33333333333337,
- "r_x1": 479.3333333333333,
- "r_y1": 336.33333333333337,
- "r_x2": 488.0,
- "r_y2": 336.33333333333337,
- "r_x3": 488.0,
- "r_y3": 312.33333333333337,
- "coord_origin": "TOPLEFT"
- },
- "text": "don't",
- "orig": "don't",
- "text_direction": "left_to_right",
- "confidence": 0.9581434600000001,
+ "confidence": 95.0,
"from_ocr": true
}
],
@@ -571,16 +471,16 @@
"layout": {
"clusters": [
{
- "id": 8,
- "label": "section_header",
+ "id": 0,
+ "label": "table",
"bbox": {
- "l": 690.10272,
- "t": 201.26337,
- "r": 719.1490499999999,
- "b": 417.96024,
+ "l": 277.4178771972656,
+ "t": 69.0385971069336,
+ "r": 524.3541717529297,
+ "b": 551.0978393554688,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7426818609237671,
+ "confidence": 0.9790208339691162,
"cells": [
{
"index": 0,
@@ -591,37 +491,22 @@
"a": 255
},
"rect": {
- "r_x0": 690.10272,
- "r_y0": 417.96024,
- "r_x1": 719.1490499999999,
- "r_y1": 417.96024,
- "r_x2": 719.1490499999999,
- "r_y2": 201.26337,
- "r_x3": 690.10272,
- "r_y3": 201.26337,
+ "r_x0": 485.66666666666663,
+ "r_y0": 97.33333333333333,
+ "r_x1": 485.66666666666663,
+ "r_y1": 190.0,
+ "r_x2": 506.3333333333333,
+ "r_y2": 190.0,
+ "r_x3": 506.3333333333333,
+ "r_y3": 97.33333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "This is a table test ",
- "orig": "This is a table test ",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- }
- ],
- "children": []
- },
- {
- "id": 13,
- "label": "picture",
- "bbox": {
- "l": 668.9778442382812,
- "t": 70.57099151611328,
- "r": 683.4164962768555,
- "b": 79.46605682373047,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.5229994654655457,
- "cells": [
+ "confidence": 89.0,
+ "from_ocr": true
+ },
{
"index": 1,
"rgba": {
@@ -631,78 +516,22 @@
"a": 255
},
"rect": {
- "r_x0": 669.96899,
- "r_y0": 78.71936000000005,
- "r_x1": 682.25806,
- "r_y1": 78.71936000000005,
- "r_x2": 682.25806,
- "r_y2": 71.99987999999996,
- "r_x3": 669.96899,
- "r_y3": 71.99987999999996,
+ "r_x0": 454.33333333333337,
+ "r_y0": 112.0,
+ "r_x1": 454.33333333333337,
+ "r_y1": 182.33333333333334,
+ "r_x2": 475.0,
+ "r_y2": 182.33333333333334,
+ "r_x3": 475.0,
+ "r_y3": 112.0,
"coord_origin": "TOPLEFT"
},
- "text": " T",
- "orig": " T",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- }
- ],
- "children": [
- {
- "id": 20,
- "label": "text",
- "bbox": {
- "l": 669.96899,
- "t": 71.99987999999996,
- "r": 682.25806,
- "b": 78.71936000000005,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 1.0,
- "cells": [
- {
- "index": 1,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 669.96899,
- "r_y0": 78.71936000000005,
- "r_x1": 682.25806,
- "r_y1": 78.71936000000005,
- "r_x2": 682.25806,
- "r_y2": 71.99987999999996,
- "r_x3": 669.96899,
- "r_y3": 71.99987999999996,
- "coord_origin": "TOPLEFT"
- },
- "text": " T",
- "orig": " T",
- "text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- }
- ],
- "children": []
- }
- ]
- },
- {
- "id": 0,
- "label": "text",
- "bbox": {
- "l": 640.87671,
- "t": 78.71447999999998,
- "r": 653.16504,
- "b": 376.27319,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.8302523493766785,
- "cells": [
+ "confidence": 92.0,
+ "from_ocr": true
+ },
{
"index": 2,
"rgba": {
@@ -712,37 +541,47 @@
"a": 255
},
"rect": {
- "r_x0": 640.87671,
- "r_y0": 376.27319,
- "r_x1": 653.16504,
- "r_y1": 376.27319,
- "r_x2": 653.16504,
- "r_y2": 78.71447999999998,
- "r_x3": 640.87671,
- "r_y3": 78.71447999999998,
+ "r_x0": 392.0,
+ "r_y0": 121.66666666666667,
+ "r_x1": 392.0,
+ "r_y1": 168.66666666666666,
+ "r_x2": 408.0,
+ "r_y2": 168.66666666666666,
+ "r_x3": 408.0,
+ "r_y3": 121.66666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "heteststartswithsomerandomtextandthenatableimage: ",
- "orig": "heteststartswithsomerandomtextandthenatableimage: ",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- }
- ],
- "children": []
- },
- {
- "id": 11,
- "label": "table",
- "bbox": {
- "l": 460.5577697753906,
- "t": 142.614013671875,
- "r": 599.0364074707031,
- "b": 499.7825622558594,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.5623787045478821,
- "cells": [
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 3,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 312.0,
+ "r_y0": 121.66666666666667,
+ "r_x1": 312.0,
+ "r_y1": 168.66666666666666,
+ "r_x2": 328.0,
+ "r_y2": 168.66666666666666,
+ "r_x3": 328.0,
+ "r_y3": 121.66666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ },
{
"index": 4,
"rgba": {
@@ -752,20 +591,20 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 275.0,
- "r_x1": 572.0,
- "r_y1": 304.0,
- "r_x2": 580.6666666666666,
- "r_y2": 304.0,
- "r_x3": 580.6666666666666,
- "r_y3": 275.0,
+ "r_x0": 485.66666666666663,
+ "r_y0": 232.66666666666666,
+ "r_x1": 485.66666666666663,
+ "r_y1": 364.0,
+ "r_x2": 506.3333333333333,
+ "r_y2": 364.0,
+ "r_x3": 506.3333333333333,
+ "r_y3": 232.66666666666666,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 0.95741158,
+ "confidence": 92.0,
"from_ocr": true
},
{
@@ -777,20 +616,20 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 308.0,
- "r_x1": 572.0,
- "r_y1": 343.66666666666663,
- "r_x2": 580.3333333333334,
- "r_y2": 343.66666666666663,
- "r_x3": 580.3333333333334,
- "r_y3": 308.0,
+ "r_x0": 459.0,
+ "r_y0": 265.66666666666663,
+ "r_x1": 459.0,
+ "r_y1": 336.0,
+ "r_x2": 475.0,
+ "r_y2": 336.0,
+ "r_x3": 475.0,
+ "r_y3": 265.66666666666663,
"coord_origin": "TOPLEFT"
},
"text": "column",
"orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9541709899999999,
+ "confidence": 94.0,
"from_ocr": true
},
{
@@ -802,20 +641,20 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 381.3333333333333,
- "r_x1": 572.0,
- "r_y1": 410.3333333333333,
- "r_x2": 580.6666666666666,
- "r_y2": 410.3333333333333,
- "r_x3": 580.6666666666666,
- "r_y3": 381.3333333333333,
+ "r_x0": 408.0,
+ "r_y0": 247.0,
+ "r_x1": 408.0,
+ "r_y1": 349.6666666666667,
+ "r_x2": 424.0,
+ "r_y2": 349.6666666666667,
+ "r_x3": 424.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.96515053,
+ "confidence": 89.0,
"from_ocr": true
},
{
@@ -827,20 +666,20 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 414.3333333333333,
- "r_x1": 572.0,
- "r_y1": 440.3333333333333,
- "r_x2": 580.3333333333334,
- "r_y2": 440.3333333333333,
- "r_x3": 580.3333333333334,
- "r_y3": 414.3333333333333,
+ "r_x0": 376.0,
+ "r_y0": 277.0,
+ "r_x1": 376.0,
+ "r_y1": 324.3333333333333,
+ "r_x2": 392.0,
+ "r_y2": 324.3333333333333,
+ "r_x3": 392.0,
+ "r_y3": 277.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9623101,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -852,20 +691,20 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 443.3333333333333,
- "r_x1": 572.0,
- "r_y1": 479.3333333333333,
- "r_x2": 580.3333333333334,
- "r_y2": 479.3333333333333,
- "r_x3": 580.3333333333334,
- "r_y3": 443.3333333333333,
+ "r_x0": 328.0,
+ "r_y0": 247.0,
+ "r_x1": 328.0,
+ "r_y1": 349.6666666666667,
+ "r_x2": 344.0,
+ "r_y2": 349.6666666666667,
+ "r_x3": 344.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.94704376,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -877,20 +716,20 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 175.0,
- "r_x1": 525.6666666666666,
- "r_y1": 204.0,
- "r_x2": 534.3333333333334,
- "r_y2": 204.0,
- "r_x3": 534.3333333333334,
- "r_y3": 175.0,
+ "r_x0": 296.6666666666667,
+ "r_y0": 277.33333333333337,
+ "r_x1": 296.6666666666667,
+ "r_y1": 324.3333333333333,
+ "r_x2": 312.6666666666667,
+ "r_y2": 324.3333333333333,
+ "r_x3": 312.6666666666667,
+ "r_y3": 277.33333333333337,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96139633,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -902,20 +741,20 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 208.0,
- "r_x1": 525.6666666666666,
- "r_y1": 225.66666666666669,
- "r_x2": 532.0,
- "r_y2": 225.66666666666669,
- "r_x3": 532.0,
- "r_y3": 208.0,
+ "r_x0": 490.33333333333337,
+ "r_y0": 406.3333333333333,
+ "r_x1": 490.33333333333337,
+ "r_y1": 518.3333333333333,
+ "r_x2": 506.3333333333333,
+ "r_y2": 518.3333333333333,
+ "r_x3": 506.3333333333333,
+ "r_y3": 406.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.9561322,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -927,20 +766,20 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 285.66666666666663,
- "r_x1": 525.6666666666666,
- "r_y1": 313.0,
- "r_x2": 532.0,
- "r_y2": 313.0,
- "r_x3": 532.0,
- "r_y3": 285.66666666666663,
+ "r_x0": 459.0,
+ "r_y0": 429.3333333333333,
+ "r_x1": 459.0,
+ "r_y1": 499.3333333333333,
+ "r_x2": 475.0,
+ "r_y2": 499.3333333333333,
+ "r_x3": 475.0,
+ "r_y3": 429.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "some",
- "orig": "some",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9615657,
+ "confidence": 94.0,
"from_ocr": true
},
{
@@ -952,20 +791,20 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 317.0,
- "r_x1": 525.6666666666666,
- "r_y1": 333.0,
- "r_x2": 534.3333333333334,
- "r_y2": 333.0,
- "r_x3": 534.3333333333334,
- "r_y3": 317.0,
+ "r_x0": 408.0,
+ "r_y0": 408.3333333333333,
+ "r_x1": 408.0,
+ "r_y1": 514.0,
+ "r_x2": 424.0,
+ "r_y2": 514.0,
+ "r_x3": 424.0,
+ "r_y3": 408.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "cell",
- "orig": "cell",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.95838455,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -977,20 +816,20 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 398.3333333333333,
- "r_x1": 525.6666666666666,
- "r_y1": 422.0,
- "r_x2": 534.3333333333334,
- "r_y2": 422.0,
- "r_x3": 534.3333333333334,
- "r_y3": 398.3333333333333,
+ "r_x0": 376.0,
+ "r_y0": 440.6666666666667,
+ "r_x1": 376.0,
+ "r_y1": 487.6666666666667,
+ "r_x2": 392.0,
+ "r_y2": 487.6666666666667,
+ "r_x3": 392.0,
+ "r_y3": 440.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9642998500000001,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -1002,20 +841,20 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 426.0,
- "r_x1": 525.6666666666666,
- "r_y1": 463.0,
- "r_x2": 534.0,
- "r_y2": 463.0,
- "r_x3": 534.0,
- "r_y3": 426.0,
+ "r_x0": 328.0,
+ "r_y0": 408.3333333333333,
+ "r_x1": 328.0,
+ "r_y1": 514.0,
+ "r_x2": 344.0,
+ "r_y2": 514.0,
+ "r_x3": 344.0,
+ "r_y3": 408.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "content",
- "orig": "content",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.96576363,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -1027,135 +866,195 @@
"a": 255
},
"rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 160.33333333333334,
- "r_x1": 479.3333333333333,
- "r_y1": 189.33333333333331,
- "r_x2": 488.0,
- "r_y2": 189.33333333333331,
- "r_x3": 488.0,
- "r_y3": 160.33333333333334,
+ "r_x0": 296.6666666666667,
+ "r_y0": 440.6666666666667,
+ "r_x1": 296.6666666666667,
+ "r_y1": 487.6666666666667,
+ "r_x2": 312.6666666666667,
+ "r_y2": 487.6666666666667,
+ "r_x3": 312.6666666666667,
+ "r_y3": 440.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96371613,
- "from_ocr": true
- },
- {
- "index": 16,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 193.33333333333331,
- "r_x1": 479.3333333333333,
- "r_y1": 219.0,
- "r_x2": 488.0,
- "r_y2": 219.0,
- "r_x3": 488.0,
- "r_y3": 193.33333333333331,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.9634315499999999,
- "from_ocr": true
- },
- {
- "index": 17,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 222.66666666666669,
- "r_x1": 479.3333333333333,
- "r_y1": 240.33333333333331,
- "r_x2": 485.6666666666667,
- "r_y2": 240.33333333333331,
- "r_x3": 485.6666666666667,
- "r_y3": 222.66666666666669,
- "coord_origin": "TOPLEFT"
- },
- "text": "row",
- "orig": "row",
- "text_direction": "left_to_right",
- "confidence": 0.9611644699999999,
- "from_ocr": true
- },
- {
- "index": 18,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 283.0,
- "r_x1": 479.3333333333333,
- "r_y1": 309.0,
- "r_x2": 487.6666666666667,
- "r_y2": 309.0,
- "r_x3": 487.6666666666667,
- "r_y3": 283.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.95751617,
- "from_ocr": true
- },
- {
- "index": 19,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 312.33333333333337,
- "r_x1": 479.3333333333333,
- "r_y1": 336.33333333333337,
- "r_x2": 488.0,
- "r_y2": 336.33333333333337,
- "r_x3": 488.0,
- "r_y3": 312.33333333333337,
- "coord_origin": "TOPLEFT"
- },
- "text": "don't",
- "orig": "don't",
- "text_direction": "left_to_right",
- "confidence": 0.9581434600000001,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": [
+ {
+ "id": 1,
+ "label": "text",
+ "bbox": {
+ "l": 485.66666666666663,
+ "t": 97.33333333333333,
+ "r": 506.3333333333333,
+ "b": 190.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 89.0,
+ "cells": [
+ {
+ "index": 0,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 485.66666666666663,
+ "r_y0": 97.33333333333333,
+ "r_x1": 485.66666666666663,
+ "r_y1": 190.0,
+ "r_x2": 506.3333333333333,
+ "r_y2": 190.0,
+ "r_x3": 506.3333333333333,
+ "r_y3": 97.33333333333333,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Vertically",
+ "orig": "Vertically",
+ "text_direction": "left_to_right",
+ "confidence": 89.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 2,
+ "label": "text",
+ "bbox": {
+ "l": 454.33333333333337,
+ "t": 112.0,
+ "r": 475.0,
+ "b": 182.33333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 92.0,
+ "cells": [
+ {
+ "index": 1,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 454.33333333333337,
+ "r_y0": 112.0,
+ "r_x1": 454.33333333333337,
+ "r_y1": 182.33333333333334,
+ "r_x2": 475.0,
+ "r_y2": 182.33333333333334,
+ "r_x3": 475.0,
+ "r_y3": 112.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "merged",
+ "orig": "merged",
+ "text_direction": "left_to_right",
+ "confidence": 92.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
{
"id": 3,
"label": "text",
"bbox": {
- "l": 572.0,
- "t": 275.0,
- "r": 580.6666666666666,
- "b": 343.66666666666663,
+ "l": 392.0,
+ "t": 121.66666666666667,
+ "r": 408.0,
+ "b": 168.66666666666666,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7740143537521362,
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 2,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 392.0,
+ "r_y0": 121.66666666666667,
+ "r_x1": 392.0,
+ "r_y1": 168.66666666666666,
+ "r_x2": 408.0,
+ "r_y2": 168.66666666666666,
+ "r_x3": 408.0,
+ "r_y3": 121.66666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 4,
+ "label": "text",
+ "bbox": {
+ "l": 312.0,
+ "t": 121.66666666666667,
+ "r": 328.0,
+ "b": 168.66666666666666,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
+ {
+ "index": 3,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 312.0,
+ "r_y0": 121.66666666666667,
+ "r_x1": 312.0,
+ "r_y1": 168.66666666666666,
+ "r_x2": 328.0,
+ "r_y2": 168.66666666666666,
+ "r_x3": 328.0,
+ "r_y3": 121.66666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 5,
+ "label": "text",
+ "bbox": {
+ "l": 485.66666666666663,
+ "t": 232.66666666666666,
+ "r": 506.3333333333333,
+ "b": 364.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 92.0,
"cells": [
{
"index": 4,
@@ -1166,22 +1065,37 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 275.0,
- "r_x1": 572.0,
- "r_y1": 304.0,
- "r_x2": 580.6666666666666,
- "r_y2": 304.0,
- "r_x3": 580.6666666666666,
- "r_y3": 275.0,
+ "r_x0": 485.66666666666663,
+ "r_y0": 232.66666666666666,
+ "r_x1": 485.66666666666663,
+ "r_y1": 364.0,
+ "r_x2": 506.3333333333333,
+ "r_y2": 364.0,
+ "r_x3": 506.3333333333333,
+ "r_y3": 232.66666666666666,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 0.95741158,
+ "confidence": 92.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 6,
+ "label": "text",
+ "bbox": {
+ "l": 459.0,
+ "t": 265.66666666666663,
+ "r": 475.0,
+ "b": 336.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
{
"index": 5,
"rgba": {
@@ -1191,36 +1105,36 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 308.0,
- "r_x1": 572.0,
- "r_y1": 343.66666666666663,
- "r_x2": 580.3333333333334,
- "r_y2": 343.66666666666663,
- "r_x3": 580.3333333333334,
- "r_y3": 308.0,
+ "r_x0": 459.0,
+ "r_y0": 265.66666666666663,
+ "r_x1": 459.0,
+ "r_y1": 336.0,
+ "r_x2": 475.0,
+ "r_y2": 336.0,
+ "r_x3": 475.0,
+ "r_y3": 265.66666666666663,
"coord_origin": "TOPLEFT"
},
"text": "column",
"orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9541709899999999,
+ "confidence": 94.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 1,
+ "id": 7,
"label": "text",
"bbox": {
- "l": 572.0,
- "t": 381.3333333333333,
- "r": 580.6666666666666,
- "b": 479.3333333333333,
+ "l": 408.0,
+ "t": 247.0,
+ "r": 424.0,
+ "b": 349.6666666666667,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7769111394882202,
+ "confidence": 89.0,
"cells": [
{
"index": 6,
@@ -1231,22 +1145,37 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 381.3333333333333,
- "r_x1": 572.0,
- "r_y1": 410.3333333333333,
- "r_x2": 580.6666666666666,
- "r_y2": 410.3333333333333,
- "r_x3": 580.6666666666666,
- "r_y3": 381.3333333333333,
+ "r_x0": 408.0,
+ "r_y0": 247.0,
+ "r_x1": 408.0,
+ "r_y1": 349.6666666666667,
+ "r_x2": 424.0,
+ "r_y2": 349.6666666666667,
+ "r_x3": 424.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.96515053,
+ "confidence": 89.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 8,
+ "label": "text",
+ "bbox": {
+ "l": 376.0,
+ "t": 277.0,
+ "r": 392.0,
+ "b": 324.3333333333333,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
{
"index": 7,
"rgba": {
@@ -1256,22 +1185,37 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 414.3333333333333,
- "r_x1": 572.0,
- "r_y1": 440.3333333333333,
- "r_x2": 580.3333333333334,
- "r_y2": 440.3333333333333,
- "r_x3": 580.3333333333334,
- "r_y3": 414.3333333333333,
+ "r_x0": 376.0,
+ "r_y0": 277.0,
+ "r_x1": 376.0,
+ "r_y1": 324.3333333333333,
+ "r_x2": 392.0,
+ "r_y2": 324.3333333333333,
+ "r_x3": 392.0,
+ "r_y3": 277.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9623101,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 9,
+ "label": "text",
+ "bbox": {
+ "l": 328.0,
+ "t": 247.0,
+ "r": 344.0,
+ "b": 349.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 8,
"rgba": {
@@ -1281,36 +1225,36 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 443.3333333333333,
- "r_x1": 572.0,
- "r_y1": 479.3333333333333,
- "r_x2": 580.3333333333334,
- "r_y2": 479.3333333333333,
- "r_x3": 580.3333333333334,
- "r_y3": 443.3333333333333,
+ "r_x0": 328.0,
+ "r_y0": 247.0,
+ "r_x1": 328.0,
+ "r_y1": 349.6666666666667,
+ "r_x2": 344.0,
+ "r_y2": 349.6666666666667,
+ "r_x3": 344.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.94704376,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 6,
+ "id": 10,
"label": "text",
"bbox": {
- "l": 525.6666666666666,
- "t": 175.0,
- "r": 534.3333333333334,
- "b": 225.66666666666669,
+ "l": 296.6666666666667,
+ "t": 277.33333333333337,
+ "r": 312.6666666666667,
+ "b": 324.3333333333333,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7583935856819153,
+ "confidence": 96.0,
"cells": [
{
"index": 9,
@@ -1321,22 +1265,37 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 175.0,
- "r_x1": 525.6666666666666,
- "r_y1": 204.0,
- "r_x2": 534.3333333333334,
- "r_y2": 204.0,
- "r_x3": 534.3333333333334,
- "r_y3": 175.0,
+ "r_x0": 296.6666666666667,
+ "r_y0": 277.33333333333337,
+ "r_x1": 296.6666666666667,
+ "r_y1": 324.3333333333333,
+ "r_x2": 312.6666666666667,
+ "r_y2": 324.3333333333333,
+ "r_x3": 312.6666666666667,
+ "r_y3": 277.33333333333337,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96139633,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 11,
+ "label": "text",
+ "bbox": {
+ "l": 490.33333333333337,
+ "t": 406.3333333333333,
+ "r": 506.3333333333333,
+ "b": 518.3333333333333,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 10,
"rgba": {
@@ -1346,36 +1305,36 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 208.0,
- "r_x1": 525.6666666666666,
- "r_y1": 225.66666666666669,
- "r_x2": 532.0,
- "r_y2": 225.66666666666669,
- "r_x3": 532.0,
- "r_y3": 208.0,
+ "r_x0": 490.33333333333337,
+ "r_y0": 406.3333333333333,
+ "r_x1": 490.33333333333337,
+ "r_y1": 518.3333333333333,
+ "r_x2": 506.3333333333333,
+ "r_y2": 518.3333333333333,
+ "r_x3": 506.3333333333333,
+ "r_y3": 406.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.9561322,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 2,
+ "id": 12,
"label": "text",
"bbox": {
- "l": 525.6666666666666,
- "t": 285.66666666666663,
- "r": 534.3333333333334,
- "b": 333.0,
+ "l": 459.0,
+ "t": 429.3333333333333,
+ "r": 475.0,
+ "b": 499.3333333333333,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7750864028930664,
+ "confidence": 94.0,
"cells": [
{
"index": 11,
@@ -1386,22 +1345,37 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 285.66666666666663,
- "r_x1": 525.6666666666666,
- "r_y1": 313.0,
- "r_x2": 532.0,
- "r_y2": 313.0,
- "r_x3": 532.0,
- "r_y3": 285.66666666666663,
+ "r_x0": 459.0,
+ "r_y0": 429.3333333333333,
+ "r_x1": 459.0,
+ "r_y1": 499.3333333333333,
+ "r_x2": 475.0,
+ "r_y2": 499.3333333333333,
+ "r_x3": 475.0,
+ "r_y3": 429.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "some",
- "orig": "some",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9615657,
+ "confidence": 94.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 13,
+ "label": "text",
+ "bbox": {
+ "l": 408.0,
+ "t": 408.3333333333333,
+ "r": 424.0,
+ "b": 514.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 12,
"rgba": {
@@ -1411,36 +1385,36 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 317.0,
- "r_x1": 525.6666666666666,
- "r_y1": 333.0,
- "r_x2": 534.3333333333334,
- "r_y2": 333.0,
- "r_x3": 534.3333333333334,
- "r_y3": 317.0,
+ "r_x0": 408.0,
+ "r_y0": 408.3333333333333,
+ "r_x1": 408.0,
+ "r_y1": 514.0,
+ "r_x2": 424.0,
+ "r_y2": 514.0,
+ "r_x3": 424.0,
+ "r_y3": 408.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "cell",
- "orig": "cell",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.95838455,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 7,
+ "id": 14,
"label": "text",
"bbox": {
- "l": 525.6666666666666,
- "t": 398.3333333333333,
- "r": 534.3333333333334,
- "b": 463.0,
+ "l": 376.0,
+ "t": 440.6666666666667,
+ "r": 392.0,
+ "b": 487.6666666666667,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7514549493789673,
+ "confidence": 96.0,
"cells": [
{
"index": 13,
@@ -1451,22 +1425,37 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 398.3333333333333,
- "r_x1": 525.6666666666666,
- "r_y1": 422.0,
- "r_x2": 534.3333333333334,
- "r_y2": 422.0,
- "r_x3": 534.3333333333334,
- "r_y3": 398.3333333333333,
+ "r_x0": 376.0,
+ "r_y0": 440.6666666666667,
+ "r_x1": 376.0,
+ "r_y1": 487.6666666666667,
+ "r_x2": 392.0,
+ "r_y2": 487.6666666666667,
+ "r_x3": 392.0,
+ "r_y3": 440.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9642998500000001,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 15,
+ "label": "text",
+ "bbox": {
+ "l": 328.0,
+ "t": 408.3333333333333,
+ "r": 344.0,
+ "b": 514.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 14,
"rgba": {
@@ -1476,36 +1465,36 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 426.0,
- "r_x1": 525.6666666666666,
- "r_y1": 463.0,
- "r_x2": 534.0,
- "r_y2": 463.0,
- "r_x3": 534.0,
- "r_y3": 426.0,
+ "r_x0": 328.0,
+ "r_y0": 408.3333333333333,
+ "r_x1": 328.0,
+ "r_y1": 514.0,
+ "r_x2": 344.0,
+ "r_y2": 514.0,
+ "r_x3": 344.0,
+ "r_y3": 408.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "content",
- "orig": "content",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.96576363,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 4,
+ "id": 16,
"label": "text",
"bbox": {
- "l": 479.3333333333333,
- "t": 160.33333333333334,
- "r": 488.0,
- "b": 240.33333333333331,
+ "l": 296.6666666666667,
+ "t": 440.6666666666667,
+ "r": 312.6666666666667,
+ "b": 487.6666666666667,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.769959032535553,
+ "confidence": 95.0,
"cells": [
{
"index": 15,
@@ -1516,135 +1505,20 @@
"a": 255
},
"rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 160.33333333333334,
- "r_x1": 479.3333333333333,
- "r_y1": 189.33333333333331,
- "r_x2": 488.0,
- "r_y2": 189.33333333333331,
- "r_x3": 488.0,
- "r_y3": 160.33333333333334,
+ "r_x0": 296.6666666666667,
+ "r_y0": 440.6666666666667,
+ "r_x1": 296.6666666666667,
+ "r_y1": 487.6666666666667,
+ "r_x2": 312.6666666666667,
+ "r_y2": 487.6666666666667,
+ "r_x3": 312.6666666666667,
+ "r_y3": 440.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96371613,
- "from_ocr": true
- },
- {
- "index": 16,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 193.33333333333331,
- "r_x1": 479.3333333333333,
- "r_y1": 219.0,
- "r_x2": 488.0,
- "r_y2": 219.0,
- "r_x3": 488.0,
- "r_y3": 193.33333333333331,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.9634315499999999,
- "from_ocr": true
- },
- {
- "index": 17,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 222.66666666666669,
- "r_x1": 479.3333333333333,
- "r_y1": 240.33333333333331,
- "r_x2": 485.6666666666667,
- "r_y2": 240.33333333333331,
- "r_x3": 485.6666666666667,
- "r_y3": 222.66666666666669,
- "coord_origin": "TOPLEFT"
- },
- "text": "row",
- "orig": "row",
- "text_direction": "left_to_right",
- "confidence": 0.9611644699999999,
- "from_ocr": true
- }
- ],
- "children": []
- },
- {
- "id": 5,
- "label": "text",
- "bbox": {
- "l": 479.3333333333333,
- "t": 283.0,
- "r": 488.0,
- "b": 336.33333333333337,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.7653545141220093,
- "cells": [
- {
- "index": 18,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 283.0,
- "r_x1": 479.3333333333333,
- "r_y1": 309.0,
- "r_x2": 487.6666666666667,
- "r_y2": 309.0,
- "r_x3": 487.6666666666667,
- "r_y3": 283.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.95751617,
- "from_ocr": true
- },
- {
- "index": 19,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 312.33333333333337,
- "r_x1": 479.3333333333333,
- "r_y1": 336.33333333333337,
- "r_x2": 488.0,
- "r_y2": 336.33333333333337,
- "r_x3": 488.0,
- "r_y3": 312.33333333333337,
- "coord_origin": "TOPLEFT"
- },
- "text": "don't",
- "orig": "don't",
- "text_direction": "left_to_right",
- "confidence": 0.9581434600000001,
+ "confidence": 95.0,
"from_ocr": true
}
],
@@ -1656,22 +1530,122 @@
},
"tablestructure": {
"table_map": {
- "11": {
+ "0": {
"label": "table",
- "id": 11,
+ "id": 0,
"page_no": 0,
"cluster": {
- "id": 11,
+ "id": 0,
"label": "table",
"bbox": {
- "l": 460.5577697753906,
- "t": 142.614013671875,
- "r": 599.0364074707031,
- "b": 499.7825622558594,
+ "l": 277.4178771972656,
+ "t": 69.0385971069336,
+ "r": 524.3541717529297,
+ "b": 551.0978393554688,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.5623787045478821,
+ "confidence": 0.9790208339691162,
"cells": [
+ {
+ "index": 0,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 485.66666666666663,
+ "r_y0": 97.33333333333333,
+ "r_x1": 485.66666666666663,
+ "r_y1": 190.0,
+ "r_x2": 506.3333333333333,
+ "r_y2": 190.0,
+ "r_x3": 506.3333333333333,
+ "r_y3": 97.33333333333333,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Vertically",
+ "orig": "Vertically",
+ "text_direction": "left_to_right",
+ "confidence": 89.0,
+ "from_ocr": true
+ },
+ {
+ "index": 1,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 454.33333333333337,
+ "r_y0": 112.0,
+ "r_x1": 454.33333333333337,
+ "r_y1": 182.33333333333334,
+ "r_x2": 475.0,
+ "r_y2": 182.33333333333334,
+ "r_x3": 475.0,
+ "r_y3": 112.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "merged",
+ "orig": "merged",
+ "text_direction": "left_to_right",
+ "confidence": 92.0,
+ "from_ocr": true
+ },
+ {
+ "index": 2,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 392.0,
+ "r_y0": 121.66666666666667,
+ "r_x1": 392.0,
+ "r_y1": 168.66666666666666,
+ "r_x2": 408.0,
+ "r_y2": 168.66666666666666,
+ "r_x3": 408.0,
+ "r_y3": 121.66666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 3,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 312.0,
+ "r_y0": 121.66666666666667,
+ "r_x1": 312.0,
+ "r_y1": 168.66666666666666,
+ "r_x2": 328.0,
+ "r_y2": 168.66666666666666,
+ "r_x3": 328.0,
+ "r_y3": 121.66666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ },
{
"index": 4,
"rgba": {
@@ -1681,20 +1655,20 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 275.0,
- "r_x1": 572.0,
- "r_y1": 304.0,
- "r_x2": 580.6666666666666,
- "r_y2": 304.0,
- "r_x3": 580.6666666666666,
- "r_y3": 275.0,
+ "r_x0": 485.66666666666663,
+ "r_y0": 232.66666666666666,
+ "r_x1": 485.66666666666663,
+ "r_y1": 364.0,
+ "r_x2": 506.3333333333333,
+ "r_y2": 364.0,
+ "r_x3": 506.3333333333333,
+ "r_y3": 232.66666666666666,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 0.95741158,
+ "confidence": 92.0,
"from_ocr": true
},
{
@@ -1706,20 +1680,20 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 308.0,
- "r_x1": 572.0,
- "r_y1": 343.66666666666663,
- "r_x2": 580.3333333333334,
- "r_y2": 343.66666666666663,
- "r_x3": 580.3333333333334,
- "r_y3": 308.0,
+ "r_x0": 459.0,
+ "r_y0": 265.66666666666663,
+ "r_x1": 459.0,
+ "r_y1": 336.0,
+ "r_x2": 475.0,
+ "r_y2": 336.0,
+ "r_x3": 475.0,
+ "r_y3": 265.66666666666663,
"coord_origin": "TOPLEFT"
},
"text": "column",
"orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9541709899999999,
+ "confidence": 94.0,
"from_ocr": true
},
{
@@ -1731,20 +1705,20 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 381.3333333333333,
- "r_x1": 572.0,
- "r_y1": 410.3333333333333,
- "r_x2": 580.6666666666666,
- "r_y2": 410.3333333333333,
- "r_x3": 580.6666666666666,
- "r_y3": 381.3333333333333,
+ "r_x0": 408.0,
+ "r_y0": 247.0,
+ "r_x1": 408.0,
+ "r_y1": 349.6666666666667,
+ "r_x2": 424.0,
+ "r_y2": 349.6666666666667,
+ "r_x3": 424.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.96515053,
+ "confidence": 89.0,
"from_ocr": true
},
{
@@ -1756,20 +1730,20 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 414.3333333333333,
- "r_x1": 572.0,
- "r_y1": 440.3333333333333,
- "r_x2": 580.3333333333334,
- "r_y2": 440.3333333333333,
- "r_x3": 580.3333333333334,
- "r_y3": 414.3333333333333,
+ "r_x0": 376.0,
+ "r_y0": 277.0,
+ "r_x1": 376.0,
+ "r_y1": 324.3333333333333,
+ "r_x2": 392.0,
+ "r_y2": 324.3333333333333,
+ "r_x3": 392.0,
+ "r_y3": 277.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9623101,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -1781,20 +1755,20 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 443.3333333333333,
- "r_x1": 572.0,
- "r_y1": 479.3333333333333,
- "r_x2": 580.3333333333334,
- "r_y2": 479.3333333333333,
- "r_x3": 580.3333333333334,
- "r_y3": 443.3333333333333,
+ "r_x0": 328.0,
+ "r_y0": 247.0,
+ "r_x1": 328.0,
+ "r_y1": 349.6666666666667,
+ "r_x2": 344.0,
+ "r_y2": 349.6666666666667,
+ "r_x3": 344.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.94704376,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -1806,20 +1780,20 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 175.0,
- "r_x1": 525.6666666666666,
- "r_y1": 204.0,
- "r_x2": 534.3333333333334,
- "r_y2": 204.0,
- "r_x3": 534.3333333333334,
- "r_y3": 175.0,
+ "r_x0": 296.6666666666667,
+ "r_y0": 277.33333333333337,
+ "r_x1": 296.6666666666667,
+ "r_y1": 324.3333333333333,
+ "r_x2": 312.6666666666667,
+ "r_y2": 324.3333333333333,
+ "r_x3": 312.6666666666667,
+ "r_y3": 277.33333333333337,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96139633,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -1831,20 +1805,20 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 208.0,
- "r_x1": 525.6666666666666,
- "r_y1": 225.66666666666669,
- "r_x2": 532.0,
- "r_y2": 225.66666666666669,
- "r_x3": 532.0,
- "r_y3": 208.0,
+ "r_x0": 490.33333333333337,
+ "r_y0": 406.3333333333333,
+ "r_x1": 490.33333333333337,
+ "r_y1": 518.3333333333333,
+ "r_x2": 506.3333333333333,
+ "r_y2": 518.3333333333333,
+ "r_x3": 506.3333333333333,
+ "r_y3": 406.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.9561322,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -1856,20 +1830,20 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 285.66666666666663,
- "r_x1": 525.6666666666666,
- "r_y1": 313.0,
- "r_x2": 532.0,
- "r_y2": 313.0,
- "r_x3": 532.0,
- "r_y3": 285.66666666666663,
+ "r_x0": 459.0,
+ "r_y0": 429.3333333333333,
+ "r_x1": 459.0,
+ "r_y1": 499.3333333333333,
+ "r_x2": 475.0,
+ "r_y2": 499.3333333333333,
+ "r_x3": 475.0,
+ "r_y3": 429.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "some",
- "orig": "some",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9615657,
+ "confidence": 94.0,
"from_ocr": true
},
{
@@ -1881,20 +1855,20 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 317.0,
- "r_x1": 525.6666666666666,
- "r_y1": 333.0,
- "r_x2": 534.3333333333334,
- "r_y2": 333.0,
- "r_x3": 534.3333333333334,
- "r_y3": 317.0,
+ "r_x0": 408.0,
+ "r_y0": 408.3333333333333,
+ "r_x1": 408.0,
+ "r_y1": 514.0,
+ "r_x2": 424.0,
+ "r_y2": 514.0,
+ "r_x3": 424.0,
+ "r_y3": 408.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "cell",
- "orig": "cell",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.95838455,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -1906,20 +1880,20 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 398.3333333333333,
- "r_x1": 525.6666666666666,
- "r_y1": 422.0,
- "r_x2": 534.3333333333334,
- "r_y2": 422.0,
- "r_x3": 534.3333333333334,
- "r_y3": 398.3333333333333,
+ "r_x0": 376.0,
+ "r_y0": 440.6666666666667,
+ "r_x1": 376.0,
+ "r_y1": 487.6666666666667,
+ "r_x2": 392.0,
+ "r_y2": 487.6666666666667,
+ "r_x3": 392.0,
+ "r_y3": 440.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9642998500000001,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -1931,20 +1905,20 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 426.0,
- "r_x1": 525.6666666666666,
- "r_y1": 463.0,
- "r_x2": 534.0,
- "r_y2": 463.0,
- "r_x3": 534.0,
- "r_y3": 426.0,
+ "r_x0": 328.0,
+ "r_y0": 408.3333333333333,
+ "r_x1": 328.0,
+ "r_y1": 514.0,
+ "r_x2": 344.0,
+ "r_y2": 514.0,
+ "r_x3": 344.0,
+ "r_y3": 408.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "content",
- "orig": "content",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.96576363,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -1956,135 +1930,195 @@
"a": 255
},
"rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 160.33333333333334,
- "r_x1": 479.3333333333333,
- "r_y1": 189.33333333333331,
- "r_x2": 488.0,
- "r_y2": 189.33333333333331,
- "r_x3": 488.0,
- "r_y3": 160.33333333333334,
+ "r_x0": 296.6666666666667,
+ "r_y0": 440.6666666666667,
+ "r_x1": 296.6666666666667,
+ "r_y1": 487.6666666666667,
+ "r_x2": 312.6666666666667,
+ "r_y2": 487.6666666666667,
+ "r_x3": 312.6666666666667,
+ "r_y3": 440.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96371613,
- "from_ocr": true
- },
- {
- "index": 16,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 193.33333333333331,
- "r_x1": 479.3333333333333,
- "r_y1": 219.0,
- "r_x2": 488.0,
- "r_y2": 219.0,
- "r_x3": 488.0,
- "r_y3": 193.33333333333331,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.9634315499999999,
- "from_ocr": true
- },
- {
- "index": 17,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 222.66666666666669,
- "r_x1": 479.3333333333333,
- "r_y1": 240.33333333333331,
- "r_x2": 485.6666666666667,
- "r_y2": 240.33333333333331,
- "r_x3": 485.6666666666667,
- "r_y3": 222.66666666666669,
- "coord_origin": "TOPLEFT"
- },
- "text": "row",
- "orig": "row",
- "text_direction": "left_to_right",
- "confidence": 0.9611644699999999,
- "from_ocr": true
- },
- {
- "index": 18,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 283.0,
- "r_x1": 479.3333333333333,
- "r_y1": 309.0,
- "r_x2": 487.6666666666667,
- "r_y2": 309.0,
- "r_x3": 487.6666666666667,
- "r_y3": 283.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.95751617,
- "from_ocr": true
- },
- {
- "index": 19,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 312.33333333333337,
- "r_x1": 479.3333333333333,
- "r_y1": 336.33333333333337,
- "r_x2": 488.0,
- "r_y2": 336.33333333333337,
- "r_x3": 488.0,
- "r_y3": 312.33333333333337,
- "coord_origin": "TOPLEFT"
- },
- "text": "don't",
- "orig": "don't",
- "text_direction": "left_to_right",
- "confidence": 0.9581434600000001,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": [
+ {
+ "id": 1,
+ "label": "text",
+ "bbox": {
+ "l": 485.66666666666663,
+ "t": 97.33333333333333,
+ "r": 506.3333333333333,
+ "b": 190.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 89.0,
+ "cells": [
+ {
+ "index": 0,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 485.66666666666663,
+ "r_y0": 97.33333333333333,
+ "r_x1": 485.66666666666663,
+ "r_y1": 190.0,
+ "r_x2": 506.3333333333333,
+ "r_y2": 190.0,
+ "r_x3": 506.3333333333333,
+ "r_y3": 97.33333333333333,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Vertically",
+ "orig": "Vertically",
+ "text_direction": "left_to_right",
+ "confidence": 89.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 2,
+ "label": "text",
+ "bbox": {
+ "l": 454.33333333333337,
+ "t": 112.0,
+ "r": 475.0,
+ "b": 182.33333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 92.0,
+ "cells": [
+ {
+ "index": 1,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 454.33333333333337,
+ "r_y0": 112.0,
+ "r_x1": 454.33333333333337,
+ "r_y1": 182.33333333333334,
+ "r_x2": 475.0,
+ "r_y2": 182.33333333333334,
+ "r_x3": 475.0,
+ "r_y3": 112.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "merged",
+ "orig": "merged",
+ "text_direction": "left_to_right",
+ "confidence": 92.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
{
"id": 3,
"label": "text",
"bbox": {
- "l": 572.0,
- "t": 275.0,
- "r": 580.6666666666666,
- "b": 343.66666666666663,
+ "l": 392.0,
+ "t": 121.66666666666667,
+ "r": 408.0,
+ "b": 168.66666666666666,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7740143537521362,
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 2,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 392.0,
+ "r_y0": 121.66666666666667,
+ "r_x1": 392.0,
+ "r_y1": 168.66666666666666,
+ "r_x2": 408.0,
+ "r_y2": 168.66666666666666,
+ "r_x3": 408.0,
+ "r_y3": 121.66666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 4,
+ "label": "text",
+ "bbox": {
+ "l": 312.0,
+ "t": 121.66666666666667,
+ "r": 328.0,
+ "b": 168.66666666666666,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
+ {
+ "index": 3,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 312.0,
+ "r_y0": 121.66666666666667,
+ "r_x1": 312.0,
+ "r_y1": 168.66666666666666,
+ "r_x2": 328.0,
+ "r_y2": 168.66666666666666,
+ "r_x3": 328.0,
+ "r_y3": 121.66666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 5,
+ "label": "text",
+ "bbox": {
+ "l": 485.66666666666663,
+ "t": 232.66666666666666,
+ "r": 506.3333333333333,
+ "b": 364.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 92.0,
"cells": [
{
"index": 4,
@@ -2095,22 +2129,37 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 275.0,
- "r_x1": 572.0,
- "r_y1": 304.0,
- "r_x2": 580.6666666666666,
- "r_y2": 304.0,
- "r_x3": 580.6666666666666,
- "r_y3": 275.0,
+ "r_x0": 485.66666666666663,
+ "r_y0": 232.66666666666666,
+ "r_x1": 485.66666666666663,
+ "r_y1": 364.0,
+ "r_x2": 506.3333333333333,
+ "r_y2": 364.0,
+ "r_x3": 506.3333333333333,
+ "r_y3": 232.66666666666666,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 0.95741158,
+ "confidence": 92.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 6,
+ "label": "text",
+ "bbox": {
+ "l": 459.0,
+ "t": 265.66666666666663,
+ "r": 475.0,
+ "b": 336.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
{
"index": 5,
"rgba": {
@@ -2120,36 +2169,36 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 308.0,
- "r_x1": 572.0,
- "r_y1": 343.66666666666663,
- "r_x2": 580.3333333333334,
- "r_y2": 343.66666666666663,
- "r_x3": 580.3333333333334,
- "r_y3": 308.0,
+ "r_x0": 459.0,
+ "r_y0": 265.66666666666663,
+ "r_x1": 459.0,
+ "r_y1": 336.0,
+ "r_x2": 475.0,
+ "r_y2": 336.0,
+ "r_x3": 475.0,
+ "r_y3": 265.66666666666663,
"coord_origin": "TOPLEFT"
},
"text": "column",
"orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9541709899999999,
+ "confidence": 94.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 1,
+ "id": 7,
"label": "text",
"bbox": {
- "l": 572.0,
- "t": 381.3333333333333,
- "r": 580.6666666666666,
- "b": 479.3333333333333,
+ "l": 408.0,
+ "t": 247.0,
+ "r": 424.0,
+ "b": 349.6666666666667,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7769111394882202,
+ "confidence": 89.0,
"cells": [
{
"index": 6,
@@ -2160,22 +2209,37 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 381.3333333333333,
- "r_x1": 572.0,
- "r_y1": 410.3333333333333,
- "r_x2": 580.6666666666666,
- "r_y2": 410.3333333333333,
- "r_x3": 580.6666666666666,
- "r_y3": 381.3333333333333,
+ "r_x0": 408.0,
+ "r_y0": 247.0,
+ "r_x1": 408.0,
+ "r_y1": 349.6666666666667,
+ "r_x2": 424.0,
+ "r_y2": 349.6666666666667,
+ "r_x3": 424.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.96515053,
+ "confidence": 89.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 8,
+ "label": "text",
+ "bbox": {
+ "l": 376.0,
+ "t": 277.0,
+ "r": 392.0,
+ "b": 324.3333333333333,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
{
"index": 7,
"rgba": {
@@ -2185,22 +2249,37 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 414.3333333333333,
- "r_x1": 572.0,
- "r_y1": 440.3333333333333,
- "r_x2": 580.3333333333334,
- "r_y2": 440.3333333333333,
- "r_x3": 580.3333333333334,
- "r_y3": 414.3333333333333,
+ "r_x0": 376.0,
+ "r_y0": 277.0,
+ "r_x1": 376.0,
+ "r_y1": 324.3333333333333,
+ "r_x2": 392.0,
+ "r_y2": 324.3333333333333,
+ "r_x3": 392.0,
+ "r_y3": 277.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9623101,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 9,
+ "label": "text",
+ "bbox": {
+ "l": 328.0,
+ "t": 247.0,
+ "r": 344.0,
+ "b": 349.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 8,
"rgba": {
@@ -2210,36 +2289,36 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 443.3333333333333,
- "r_x1": 572.0,
- "r_y1": 479.3333333333333,
- "r_x2": 580.3333333333334,
- "r_y2": 479.3333333333333,
- "r_x3": 580.3333333333334,
- "r_y3": 443.3333333333333,
+ "r_x0": 328.0,
+ "r_y0": 247.0,
+ "r_x1": 328.0,
+ "r_y1": 349.6666666666667,
+ "r_x2": 344.0,
+ "r_y2": 349.6666666666667,
+ "r_x3": 344.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.94704376,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 6,
+ "id": 10,
"label": "text",
"bbox": {
- "l": 525.6666666666666,
- "t": 175.0,
- "r": 534.3333333333334,
- "b": 225.66666666666669,
+ "l": 296.6666666666667,
+ "t": 277.33333333333337,
+ "r": 312.6666666666667,
+ "b": 324.3333333333333,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7583935856819153,
+ "confidence": 96.0,
"cells": [
{
"index": 9,
@@ -2250,22 +2329,37 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 175.0,
- "r_x1": 525.6666666666666,
- "r_y1": 204.0,
- "r_x2": 534.3333333333334,
- "r_y2": 204.0,
- "r_x3": 534.3333333333334,
- "r_y3": 175.0,
+ "r_x0": 296.6666666666667,
+ "r_y0": 277.33333333333337,
+ "r_x1": 296.6666666666667,
+ "r_y1": 324.3333333333333,
+ "r_x2": 312.6666666666667,
+ "r_y2": 324.3333333333333,
+ "r_x3": 312.6666666666667,
+ "r_y3": 277.33333333333337,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96139633,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 11,
+ "label": "text",
+ "bbox": {
+ "l": 490.33333333333337,
+ "t": 406.3333333333333,
+ "r": 506.3333333333333,
+ "b": 518.3333333333333,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 10,
"rgba": {
@@ -2275,36 +2369,36 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 208.0,
- "r_x1": 525.6666666666666,
- "r_y1": 225.66666666666669,
- "r_x2": 532.0,
- "r_y2": 225.66666666666669,
- "r_x3": 532.0,
- "r_y3": 208.0,
+ "r_x0": 490.33333333333337,
+ "r_y0": 406.3333333333333,
+ "r_x1": 490.33333333333337,
+ "r_y1": 518.3333333333333,
+ "r_x2": 506.3333333333333,
+ "r_y2": 518.3333333333333,
+ "r_x3": 506.3333333333333,
+ "r_y3": 406.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.9561322,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 2,
+ "id": 12,
"label": "text",
"bbox": {
- "l": 525.6666666666666,
- "t": 285.66666666666663,
- "r": 534.3333333333334,
- "b": 333.0,
+ "l": 459.0,
+ "t": 429.3333333333333,
+ "r": 475.0,
+ "b": 499.3333333333333,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7750864028930664,
+ "confidence": 94.0,
"cells": [
{
"index": 11,
@@ -2315,22 +2409,37 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 285.66666666666663,
- "r_x1": 525.6666666666666,
- "r_y1": 313.0,
- "r_x2": 532.0,
- "r_y2": 313.0,
- "r_x3": 532.0,
- "r_y3": 285.66666666666663,
+ "r_x0": 459.0,
+ "r_y0": 429.3333333333333,
+ "r_x1": 459.0,
+ "r_y1": 499.3333333333333,
+ "r_x2": 475.0,
+ "r_y2": 499.3333333333333,
+ "r_x3": 475.0,
+ "r_y3": 429.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "some",
- "orig": "some",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9615657,
+ "confidence": 94.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 13,
+ "label": "text",
+ "bbox": {
+ "l": 408.0,
+ "t": 408.3333333333333,
+ "r": 424.0,
+ "b": 514.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 12,
"rgba": {
@@ -2340,36 +2449,36 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 317.0,
- "r_x1": 525.6666666666666,
- "r_y1": 333.0,
- "r_x2": 534.3333333333334,
- "r_y2": 333.0,
- "r_x3": 534.3333333333334,
- "r_y3": 317.0,
+ "r_x0": 408.0,
+ "r_y0": 408.3333333333333,
+ "r_x1": 408.0,
+ "r_y1": 514.0,
+ "r_x2": 424.0,
+ "r_y2": 514.0,
+ "r_x3": 424.0,
+ "r_y3": 408.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "cell",
- "orig": "cell",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.95838455,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 7,
+ "id": 14,
"label": "text",
"bbox": {
- "l": 525.6666666666666,
- "t": 398.3333333333333,
- "r": 534.3333333333334,
- "b": 463.0,
+ "l": 376.0,
+ "t": 440.6666666666667,
+ "r": 392.0,
+ "b": 487.6666666666667,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7514549493789673,
+ "confidence": 96.0,
"cells": [
{
"index": 13,
@@ -2380,22 +2489,37 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 398.3333333333333,
- "r_x1": 525.6666666666666,
- "r_y1": 422.0,
- "r_x2": 534.3333333333334,
- "r_y2": 422.0,
- "r_x3": 534.3333333333334,
- "r_y3": 398.3333333333333,
+ "r_x0": 376.0,
+ "r_y0": 440.6666666666667,
+ "r_x1": 376.0,
+ "r_y1": 487.6666666666667,
+ "r_x2": 392.0,
+ "r_y2": 487.6666666666667,
+ "r_x3": 392.0,
+ "r_y3": 440.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9642998500000001,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 15,
+ "label": "text",
+ "bbox": {
+ "l": 328.0,
+ "t": 408.3333333333333,
+ "r": 344.0,
+ "b": 514.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 14,
"rgba": {
@@ -2405,36 +2529,36 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 426.0,
- "r_x1": 525.6666666666666,
- "r_y1": 463.0,
- "r_x2": 534.0,
- "r_y2": 463.0,
- "r_x3": 534.0,
- "r_y3": 426.0,
+ "r_x0": 328.0,
+ "r_y0": 408.3333333333333,
+ "r_x1": 328.0,
+ "r_y1": 514.0,
+ "r_x2": 344.0,
+ "r_y2": 514.0,
+ "r_x3": 344.0,
+ "r_y3": 408.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "content",
- "orig": "content",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.96576363,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 4,
+ "id": 16,
"label": "text",
"bbox": {
- "l": 479.3333333333333,
- "t": 160.33333333333334,
- "r": 488.0,
- "b": 240.33333333333331,
+ "l": 296.6666666666667,
+ "t": 440.6666666666667,
+ "r": 312.6666666666667,
+ "b": 487.6666666666667,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.769959032535553,
+ "confidence": 95.0,
"cells": [
{
"index": 15,
@@ -2445,135 +2569,20 @@
"a": 255
},
"rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 160.33333333333334,
- "r_x1": 479.3333333333333,
- "r_y1": 189.33333333333331,
- "r_x2": 488.0,
- "r_y2": 189.33333333333331,
- "r_x3": 488.0,
- "r_y3": 160.33333333333334,
+ "r_x0": 296.6666666666667,
+ "r_y0": 440.6666666666667,
+ "r_x1": 296.6666666666667,
+ "r_y1": 487.6666666666667,
+ "r_x2": 312.6666666666667,
+ "r_y2": 487.6666666666667,
+ "r_x3": 312.6666666666667,
+ "r_y3": 440.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96371613,
- "from_ocr": true
- },
- {
- "index": 16,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 193.33333333333331,
- "r_x1": 479.3333333333333,
- "r_y1": 219.0,
- "r_x2": 488.0,
- "r_y2": 219.0,
- "r_x3": 488.0,
- "r_y3": 193.33333333333331,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.9634315499999999,
- "from_ocr": true
- },
- {
- "index": 17,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 222.66666666666669,
- "r_x1": 479.3333333333333,
- "r_y1": 240.33333333333331,
- "r_x2": 485.6666666666667,
- "r_y2": 240.33333333333331,
- "r_x3": 485.6666666666667,
- "r_y3": 222.66666666666669,
- "coord_origin": "TOPLEFT"
- },
- "text": "row",
- "orig": "row",
- "text_direction": "left_to_right",
- "confidence": 0.9611644699999999,
- "from_ocr": true
- }
- ],
- "children": []
- },
- {
- "id": 5,
- "label": "text",
- "bbox": {
- "l": 479.3333333333333,
- "t": 283.0,
- "r": 488.0,
- "b": 336.33333333333337,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.7653545141220093,
- "cells": [
- {
- "index": 18,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 283.0,
- "r_x1": 479.3333333333333,
- "r_y1": 309.0,
- "r_x2": 487.6666666666667,
- "r_y2": 309.0,
- "r_x3": 487.6666666666667,
- "r_y3": 283.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.95751617,
- "from_ocr": true
- },
- {
- "index": 19,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 312.33333333333337,
- "r_x1": 479.3333333333333,
- "r_y1": 336.33333333333337,
- "r_x2": 488.0,
- "r_y2": 336.33333333333337,
- "r_x3": 488.0,
- "r_y3": 312.33333333333337,
- "coord_origin": "TOPLEFT"
- },
- "text": "don't",
- "orig": "don't",
- "text_direction": "left_to_right",
- "confidence": 0.9581434600000001,
+ "confidence": 95.0,
"from_ocr": true
}
],
@@ -2583,22 +2592,80 @@
},
"text": null,
"otsl_seq": [
- "ecel",
+ "ched",
"ched",
"ched",
"nl",
- "rhed",
+ "fcel",
"fcel",
"fcel",
"nl",
- "rhed",
"fcel",
- "ecel",
+ "fcel",
+ "fcel",
"nl"
],
- "num_rows": 0,
- "num_cols": 0,
- "table_cells": []
+ "num_rows": 1,
+ "num_cols": 3,
+ "table_cells": [
+ {
+ "bbox": {
+ "l": 443.33333333333337,
+ "t": 312.0,
+ "r": 490.33333333333337,
+ "b": 328.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 262.3333333333333,
+ "t": 296.6666666666667,
+ "r": 365.0,
+ "b": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Some other value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 98.0,
+ "t": 296.6666666666667,
+ "r": 203.66666666666669,
+ "b": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 0,
+ "end_col_offset_idx": 1,
+ "text": "Yet another value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ }
+ ]
}
}
},
@@ -2609,20 +2676,20 @@
"assembled": {
"elements": [
{
- "label": "section_header",
- "id": 8,
+ "label": "table",
+ "id": 0,
"page_no": 0,
"cluster": {
- "id": 8,
- "label": "section_header",
+ "id": 0,
+ "label": "table",
"bbox": {
- "l": 690.10272,
- "t": 201.26337,
- "r": 719.1490499999999,
- "b": 417.96024,
+ "l": 277.4178771972656,
+ "t": 69.0385971069336,
+ "r": 524.3541717529297,
+ "b": 551.0978393554688,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7426818609237671,
+ "confidence": 0.9790208339691162,
"cells": [
{
"index": 0,
@@ -2633,43 +2700,22 @@
"a": 255
},
"rect": {
- "r_x0": 690.10272,
- "r_y0": 417.96024,
- "r_x1": 719.1490499999999,
- "r_y1": 417.96024,
- "r_x2": 719.1490499999999,
- "r_y2": 201.26337,
- "r_x3": 690.10272,
- "r_y3": 201.26337,
+ "r_x0": 485.66666666666663,
+ "r_y0": 97.33333333333333,
+ "r_x1": 485.66666666666663,
+ "r_y1": 190.0,
+ "r_x2": 506.3333333333333,
+ "r_y2": 190.0,
+ "r_x3": 506.3333333333333,
+ "r_y3": 97.33333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "This is a table test ",
- "orig": "This is a table test ",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- }
- ],
- "children": []
- },
- "text": "This is a table test"
- },
- {
- "label": "picture",
- "id": 13,
- "page_no": 0,
- "cluster": {
- "id": 13,
- "label": "picture",
- "bbox": {
- "l": 668.9778442382812,
- "t": 70.57099151611328,
- "r": 683.4164962768555,
- "b": 79.46605682373047,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.5229994654655457,
- "cells": [
+ "confidence": 89.0,
+ "from_ocr": true
+ },
{
"index": 1,
"rgba": {
@@ -2679,88 +2725,22 @@
"a": 255
},
"rect": {
- "r_x0": 669.96899,
- "r_y0": 78.71936000000005,
- "r_x1": 682.25806,
- "r_y1": 78.71936000000005,
- "r_x2": 682.25806,
- "r_y2": 71.99987999999996,
- "r_x3": 669.96899,
- "r_y3": 71.99987999999996,
+ "r_x0": 454.33333333333337,
+ "r_y0": 112.0,
+ "r_x1": 454.33333333333337,
+ "r_y1": 182.33333333333334,
+ "r_x2": 475.0,
+ "r_y2": 182.33333333333334,
+ "r_x3": 475.0,
+ "r_y3": 112.0,
"coord_origin": "TOPLEFT"
},
- "text": " T",
- "orig": " T",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- }
- ],
- "children": [
- {
- "id": 20,
- "label": "text",
- "bbox": {
- "l": 669.96899,
- "t": 71.99987999999996,
- "r": 682.25806,
- "b": 78.71936000000005,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 1.0,
- "cells": [
- {
- "index": 1,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 669.96899,
- "r_y0": 78.71936000000005,
- "r_x1": 682.25806,
- "r_y1": 78.71936000000005,
- "r_x2": 682.25806,
- "r_y2": 71.99987999999996,
- "r_x3": 669.96899,
- "r_y3": 71.99987999999996,
- "coord_origin": "TOPLEFT"
- },
- "text": " T",
- "orig": " T",
- "text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- }
- ],
- "children": []
- }
- ]
- },
- "text": "",
- "annotations": [],
- "provenance": null,
- "predicted_class": null,
- "confidence": null
- },
- {
- "label": "text",
- "id": 0,
- "page_no": 0,
- "cluster": {
- "id": 0,
- "label": "text",
- "bbox": {
- "l": 640.87671,
- "t": 78.71447999999998,
- "r": 653.16504,
- "b": 376.27319,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.8302523493766785,
- "cells": [
+ "confidence": 92.0,
+ "from_ocr": true
+ },
{
"index": 2,
"rgba": {
@@ -2770,43 +2750,47 @@
"a": 255
},
"rect": {
- "r_x0": 640.87671,
- "r_y0": 376.27319,
- "r_x1": 653.16504,
- "r_y1": 376.27319,
- "r_x2": 653.16504,
- "r_y2": 78.71447999999998,
- "r_x3": 640.87671,
- "r_y3": 78.71447999999998,
+ "r_x0": 392.0,
+ "r_y0": 121.66666666666667,
+ "r_x1": 392.0,
+ "r_y1": 168.66666666666666,
+ "r_x2": 408.0,
+ "r_y2": 168.66666666666666,
+ "r_x3": 408.0,
+ "r_y3": 121.66666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "heteststartswithsomerandomtextandthenatableimage: ",
- "orig": "heteststartswithsomerandomtextandthenatableimage: ",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- }
- ],
- "children": []
- },
- "text": "heteststartswithsomerandomtextandthenatableimage:"
- },
- {
- "label": "table",
- "id": 11,
- "page_no": 0,
- "cluster": {
- "id": 11,
- "label": "table",
- "bbox": {
- "l": 460.5577697753906,
- "t": 142.614013671875,
- "r": 599.0364074707031,
- "b": 499.7825622558594,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.5623787045478821,
- "cells": [
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 3,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 312.0,
+ "r_y0": 121.66666666666667,
+ "r_x1": 312.0,
+ "r_y1": 168.66666666666666,
+ "r_x2": 328.0,
+ "r_y2": 168.66666666666666,
+ "r_x3": 328.0,
+ "r_y3": 121.66666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ },
{
"index": 4,
"rgba": {
@@ -2816,20 +2800,20 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 275.0,
- "r_x1": 572.0,
- "r_y1": 304.0,
- "r_x2": 580.6666666666666,
- "r_y2": 304.0,
- "r_x3": 580.6666666666666,
- "r_y3": 275.0,
+ "r_x0": 485.66666666666663,
+ "r_y0": 232.66666666666666,
+ "r_x1": 485.66666666666663,
+ "r_y1": 364.0,
+ "r_x2": 506.3333333333333,
+ "r_y2": 364.0,
+ "r_x3": 506.3333333333333,
+ "r_y3": 232.66666666666666,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 0.95741158,
+ "confidence": 92.0,
"from_ocr": true
},
{
@@ -2841,20 +2825,20 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 308.0,
- "r_x1": 572.0,
- "r_y1": 343.66666666666663,
- "r_x2": 580.3333333333334,
- "r_y2": 343.66666666666663,
- "r_x3": 580.3333333333334,
- "r_y3": 308.0,
+ "r_x0": 459.0,
+ "r_y0": 265.66666666666663,
+ "r_x1": 459.0,
+ "r_y1": 336.0,
+ "r_x2": 475.0,
+ "r_y2": 336.0,
+ "r_x3": 475.0,
+ "r_y3": 265.66666666666663,
"coord_origin": "TOPLEFT"
},
"text": "column",
"orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9541709899999999,
+ "confidence": 94.0,
"from_ocr": true
},
{
@@ -2866,20 +2850,20 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 381.3333333333333,
- "r_x1": 572.0,
- "r_y1": 410.3333333333333,
- "r_x2": 580.6666666666666,
- "r_y2": 410.3333333333333,
- "r_x3": 580.6666666666666,
- "r_y3": 381.3333333333333,
+ "r_x0": 408.0,
+ "r_y0": 247.0,
+ "r_x1": 408.0,
+ "r_y1": 349.6666666666667,
+ "r_x2": 424.0,
+ "r_y2": 349.6666666666667,
+ "r_x3": 424.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.96515053,
+ "confidence": 89.0,
"from_ocr": true
},
{
@@ -2891,20 +2875,20 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 414.3333333333333,
- "r_x1": 572.0,
- "r_y1": 440.3333333333333,
- "r_x2": 580.3333333333334,
- "r_y2": 440.3333333333333,
- "r_x3": 580.3333333333334,
- "r_y3": 414.3333333333333,
+ "r_x0": 376.0,
+ "r_y0": 277.0,
+ "r_x1": 376.0,
+ "r_y1": 324.3333333333333,
+ "r_x2": 392.0,
+ "r_y2": 324.3333333333333,
+ "r_x3": 392.0,
+ "r_y3": 277.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9623101,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -2916,20 +2900,20 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 443.3333333333333,
- "r_x1": 572.0,
- "r_y1": 479.3333333333333,
- "r_x2": 580.3333333333334,
- "r_y2": 479.3333333333333,
- "r_x3": 580.3333333333334,
- "r_y3": 443.3333333333333,
+ "r_x0": 328.0,
+ "r_y0": 247.0,
+ "r_x1": 328.0,
+ "r_y1": 349.6666666666667,
+ "r_x2": 344.0,
+ "r_y2": 349.6666666666667,
+ "r_x3": 344.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.94704376,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -2941,20 +2925,20 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 175.0,
- "r_x1": 525.6666666666666,
- "r_y1": 204.0,
- "r_x2": 534.3333333333334,
- "r_y2": 204.0,
- "r_x3": 534.3333333333334,
- "r_y3": 175.0,
+ "r_x0": 296.6666666666667,
+ "r_y0": 277.33333333333337,
+ "r_x1": 296.6666666666667,
+ "r_y1": 324.3333333333333,
+ "r_x2": 312.6666666666667,
+ "r_y2": 324.3333333333333,
+ "r_x3": 312.6666666666667,
+ "r_y3": 277.33333333333337,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96139633,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -2966,20 +2950,20 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 208.0,
- "r_x1": 525.6666666666666,
- "r_y1": 225.66666666666669,
- "r_x2": 532.0,
- "r_y2": 225.66666666666669,
- "r_x3": 532.0,
- "r_y3": 208.0,
+ "r_x0": 490.33333333333337,
+ "r_y0": 406.3333333333333,
+ "r_x1": 490.33333333333337,
+ "r_y1": 518.3333333333333,
+ "r_x2": 506.3333333333333,
+ "r_y2": 518.3333333333333,
+ "r_x3": 506.3333333333333,
+ "r_y3": 406.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.9561322,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -2991,20 +2975,20 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 285.66666666666663,
- "r_x1": 525.6666666666666,
- "r_y1": 313.0,
- "r_x2": 532.0,
- "r_y2": 313.0,
- "r_x3": 532.0,
- "r_y3": 285.66666666666663,
+ "r_x0": 459.0,
+ "r_y0": 429.3333333333333,
+ "r_x1": 459.0,
+ "r_y1": 499.3333333333333,
+ "r_x2": 475.0,
+ "r_y2": 499.3333333333333,
+ "r_x3": 475.0,
+ "r_y3": 429.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "some",
- "orig": "some",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9615657,
+ "confidence": 94.0,
"from_ocr": true
},
{
@@ -3016,20 +3000,20 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 317.0,
- "r_x1": 525.6666666666666,
- "r_y1": 333.0,
- "r_x2": 534.3333333333334,
- "r_y2": 333.0,
- "r_x3": 534.3333333333334,
- "r_y3": 317.0,
+ "r_x0": 408.0,
+ "r_y0": 408.3333333333333,
+ "r_x1": 408.0,
+ "r_y1": 514.0,
+ "r_x2": 424.0,
+ "r_y2": 514.0,
+ "r_x3": 424.0,
+ "r_y3": 408.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "cell",
- "orig": "cell",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.95838455,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -3041,20 +3025,20 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 398.3333333333333,
- "r_x1": 525.6666666666666,
- "r_y1": 422.0,
- "r_x2": 534.3333333333334,
- "r_y2": 422.0,
- "r_x3": 534.3333333333334,
- "r_y3": 398.3333333333333,
+ "r_x0": 376.0,
+ "r_y0": 440.6666666666667,
+ "r_x1": 376.0,
+ "r_y1": 487.6666666666667,
+ "r_x2": 392.0,
+ "r_y2": 487.6666666666667,
+ "r_x3": 392.0,
+ "r_y3": 440.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9642998500000001,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -3066,20 +3050,20 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 426.0,
- "r_x1": 525.6666666666666,
- "r_y1": 463.0,
- "r_x2": 534.0,
- "r_y2": 463.0,
- "r_x3": 534.0,
- "r_y3": 426.0,
+ "r_x0": 328.0,
+ "r_y0": 408.3333333333333,
+ "r_x1": 328.0,
+ "r_y1": 514.0,
+ "r_x2": 344.0,
+ "r_y2": 514.0,
+ "r_x3": 344.0,
+ "r_y3": 408.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "content",
- "orig": "content",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.96576363,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -3091,135 +3075,195 @@
"a": 255
},
"rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 160.33333333333334,
- "r_x1": 479.3333333333333,
- "r_y1": 189.33333333333331,
- "r_x2": 488.0,
- "r_y2": 189.33333333333331,
- "r_x3": 488.0,
- "r_y3": 160.33333333333334,
+ "r_x0": 296.6666666666667,
+ "r_y0": 440.6666666666667,
+ "r_x1": 296.6666666666667,
+ "r_y1": 487.6666666666667,
+ "r_x2": 312.6666666666667,
+ "r_y2": 487.6666666666667,
+ "r_x3": 312.6666666666667,
+ "r_y3": 440.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96371613,
- "from_ocr": true
- },
- {
- "index": 16,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 193.33333333333331,
- "r_x1": 479.3333333333333,
- "r_y1": 219.0,
- "r_x2": 488.0,
- "r_y2": 219.0,
- "r_x3": 488.0,
- "r_y3": 193.33333333333331,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.9634315499999999,
- "from_ocr": true
- },
- {
- "index": 17,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 222.66666666666669,
- "r_x1": 479.3333333333333,
- "r_y1": 240.33333333333331,
- "r_x2": 485.6666666666667,
- "r_y2": 240.33333333333331,
- "r_x3": 485.6666666666667,
- "r_y3": 222.66666666666669,
- "coord_origin": "TOPLEFT"
- },
- "text": "row",
- "orig": "row",
- "text_direction": "left_to_right",
- "confidence": 0.9611644699999999,
- "from_ocr": true
- },
- {
- "index": 18,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 283.0,
- "r_x1": 479.3333333333333,
- "r_y1": 309.0,
- "r_x2": 487.6666666666667,
- "r_y2": 309.0,
- "r_x3": 487.6666666666667,
- "r_y3": 283.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.95751617,
- "from_ocr": true
- },
- {
- "index": 19,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 312.33333333333337,
- "r_x1": 479.3333333333333,
- "r_y1": 336.33333333333337,
- "r_x2": 488.0,
- "r_y2": 336.33333333333337,
- "r_x3": 488.0,
- "r_y3": 312.33333333333337,
- "coord_origin": "TOPLEFT"
- },
- "text": "don't",
- "orig": "don't",
- "text_direction": "left_to_right",
- "confidence": 0.9581434600000001,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": [
+ {
+ "id": 1,
+ "label": "text",
+ "bbox": {
+ "l": 485.66666666666663,
+ "t": 97.33333333333333,
+ "r": 506.3333333333333,
+ "b": 190.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 89.0,
+ "cells": [
+ {
+ "index": 0,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 485.66666666666663,
+ "r_y0": 97.33333333333333,
+ "r_x1": 485.66666666666663,
+ "r_y1": 190.0,
+ "r_x2": 506.3333333333333,
+ "r_y2": 190.0,
+ "r_x3": 506.3333333333333,
+ "r_y3": 97.33333333333333,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Vertically",
+ "orig": "Vertically",
+ "text_direction": "left_to_right",
+ "confidence": 89.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 2,
+ "label": "text",
+ "bbox": {
+ "l": 454.33333333333337,
+ "t": 112.0,
+ "r": 475.0,
+ "b": 182.33333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 92.0,
+ "cells": [
+ {
+ "index": 1,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 454.33333333333337,
+ "r_y0": 112.0,
+ "r_x1": 454.33333333333337,
+ "r_y1": 182.33333333333334,
+ "r_x2": 475.0,
+ "r_y2": 182.33333333333334,
+ "r_x3": 475.0,
+ "r_y3": 112.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "merged",
+ "orig": "merged",
+ "text_direction": "left_to_right",
+ "confidence": 92.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
{
"id": 3,
"label": "text",
"bbox": {
- "l": 572.0,
- "t": 275.0,
- "r": 580.6666666666666,
- "b": 343.66666666666663,
+ "l": 392.0,
+ "t": 121.66666666666667,
+ "r": 408.0,
+ "b": 168.66666666666666,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7740143537521362,
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 2,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 392.0,
+ "r_y0": 121.66666666666667,
+ "r_x1": 392.0,
+ "r_y1": 168.66666666666666,
+ "r_x2": 408.0,
+ "r_y2": 168.66666666666666,
+ "r_x3": 408.0,
+ "r_y3": 121.66666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 4,
+ "label": "text",
+ "bbox": {
+ "l": 312.0,
+ "t": 121.66666666666667,
+ "r": 328.0,
+ "b": 168.66666666666666,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
+ {
+ "index": 3,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 312.0,
+ "r_y0": 121.66666666666667,
+ "r_x1": 312.0,
+ "r_y1": 168.66666666666666,
+ "r_x2": 328.0,
+ "r_y2": 168.66666666666666,
+ "r_x3": 328.0,
+ "r_y3": 121.66666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 5,
+ "label": "text",
+ "bbox": {
+ "l": 485.66666666666663,
+ "t": 232.66666666666666,
+ "r": 506.3333333333333,
+ "b": 364.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 92.0,
"cells": [
{
"index": 4,
@@ -3230,22 +3274,37 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 275.0,
- "r_x1": 572.0,
- "r_y1": 304.0,
- "r_x2": 580.6666666666666,
- "r_y2": 304.0,
- "r_x3": 580.6666666666666,
- "r_y3": 275.0,
+ "r_x0": 485.66666666666663,
+ "r_y0": 232.66666666666666,
+ "r_x1": 485.66666666666663,
+ "r_y1": 364.0,
+ "r_x2": 506.3333333333333,
+ "r_y2": 364.0,
+ "r_x3": 506.3333333333333,
+ "r_y3": 232.66666666666666,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 0.95741158,
+ "confidence": 92.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 6,
+ "label": "text",
+ "bbox": {
+ "l": 459.0,
+ "t": 265.66666666666663,
+ "r": 475.0,
+ "b": 336.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
{
"index": 5,
"rgba": {
@@ -3255,36 +3314,36 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 308.0,
- "r_x1": 572.0,
- "r_y1": 343.66666666666663,
- "r_x2": 580.3333333333334,
- "r_y2": 343.66666666666663,
- "r_x3": 580.3333333333334,
- "r_y3": 308.0,
+ "r_x0": 459.0,
+ "r_y0": 265.66666666666663,
+ "r_x1": 459.0,
+ "r_y1": 336.0,
+ "r_x2": 475.0,
+ "r_y2": 336.0,
+ "r_x3": 475.0,
+ "r_y3": 265.66666666666663,
"coord_origin": "TOPLEFT"
},
"text": "column",
"orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9541709899999999,
+ "confidence": 94.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 1,
+ "id": 7,
"label": "text",
"bbox": {
- "l": 572.0,
- "t": 381.3333333333333,
- "r": 580.6666666666666,
- "b": 479.3333333333333,
+ "l": 408.0,
+ "t": 247.0,
+ "r": 424.0,
+ "b": 349.6666666666667,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7769111394882202,
+ "confidence": 89.0,
"cells": [
{
"index": 6,
@@ -3295,22 +3354,37 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 381.3333333333333,
- "r_x1": 572.0,
- "r_y1": 410.3333333333333,
- "r_x2": 580.6666666666666,
- "r_y2": 410.3333333333333,
- "r_x3": 580.6666666666666,
- "r_y3": 381.3333333333333,
+ "r_x0": 408.0,
+ "r_y0": 247.0,
+ "r_x1": 408.0,
+ "r_y1": 349.6666666666667,
+ "r_x2": 424.0,
+ "r_y2": 349.6666666666667,
+ "r_x3": 424.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.96515053,
+ "confidence": 89.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 8,
+ "label": "text",
+ "bbox": {
+ "l": 376.0,
+ "t": 277.0,
+ "r": 392.0,
+ "b": 324.3333333333333,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
{
"index": 7,
"rgba": {
@@ -3320,22 +3394,37 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 414.3333333333333,
- "r_x1": 572.0,
- "r_y1": 440.3333333333333,
- "r_x2": 580.3333333333334,
- "r_y2": 440.3333333333333,
- "r_x3": 580.3333333333334,
- "r_y3": 414.3333333333333,
+ "r_x0": 376.0,
+ "r_y0": 277.0,
+ "r_x1": 376.0,
+ "r_y1": 324.3333333333333,
+ "r_x2": 392.0,
+ "r_y2": 324.3333333333333,
+ "r_x3": 392.0,
+ "r_y3": 277.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9623101,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 9,
+ "label": "text",
+ "bbox": {
+ "l": 328.0,
+ "t": 247.0,
+ "r": 344.0,
+ "b": 349.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 8,
"rgba": {
@@ -3345,36 +3434,36 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 443.3333333333333,
- "r_x1": 572.0,
- "r_y1": 479.3333333333333,
- "r_x2": 580.3333333333334,
- "r_y2": 479.3333333333333,
- "r_x3": 580.3333333333334,
- "r_y3": 443.3333333333333,
+ "r_x0": 328.0,
+ "r_y0": 247.0,
+ "r_x1": 328.0,
+ "r_y1": 349.6666666666667,
+ "r_x2": 344.0,
+ "r_y2": 349.6666666666667,
+ "r_x3": 344.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.94704376,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 6,
+ "id": 10,
"label": "text",
"bbox": {
- "l": 525.6666666666666,
- "t": 175.0,
- "r": 534.3333333333334,
- "b": 225.66666666666669,
+ "l": 296.6666666666667,
+ "t": 277.33333333333337,
+ "r": 312.6666666666667,
+ "b": 324.3333333333333,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7583935856819153,
+ "confidence": 96.0,
"cells": [
{
"index": 9,
@@ -3385,22 +3474,37 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 175.0,
- "r_x1": 525.6666666666666,
- "r_y1": 204.0,
- "r_x2": 534.3333333333334,
- "r_y2": 204.0,
- "r_x3": 534.3333333333334,
- "r_y3": 175.0,
+ "r_x0": 296.6666666666667,
+ "r_y0": 277.33333333333337,
+ "r_x1": 296.6666666666667,
+ "r_y1": 324.3333333333333,
+ "r_x2": 312.6666666666667,
+ "r_y2": 324.3333333333333,
+ "r_x3": 312.6666666666667,
+ "r_y3": 277.33333333333337,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96139633,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 11,
+ "label": "text",
+ "bbox": {
+ "l": 490.33333333333337,
+ "t": 406.3333333333333,
+ "r": 506.3333333333333,
+ "b": 518.3333333333333,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 10,
"rgba": {
@@ -3410,36 +3514,36 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 208.0,
- "r_x1": 525.6666666666666,
- "r_y1": 225.66666666666669,
- "r_x2": 532.0,
- "r_y2": 225.66666666666669,
- "r_x3": 532.0,
- "r_y3": 208.0,
+ "r_x0": 490.33333333333337,
+ "r_y0": 406.3333333333333,
+ "r_x1": 490.33333333333337,
+ "r_y1": 518.3333333333333,
+ "r_x2": 506.3333333333333,
+ "r_y2": 518.3333333333333,
+ "r_x3": 506.3333333333333,
+ "r_y3": 406.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.9561322,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 2,
+ "id": 12,
"label": "text",
"bbox": {
- "l": 525.6666666666666,
- "t": 285.66666666666663,
- "r": 534.3333333333334,
- "b": 333.0,
+ "l": 459.0,
+ "t": 429.3333333333333,
+ "r": 475.0,
+ "b": 499.3333333333333,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7750864028930664,
+ "confidence": 94.0,
"cells": [
{
"index": 11,
@@ -3450,22 +3554,37 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 285.66666666666663,
- "r_x1": 525.6666666666666,
- "r_y1": 313.0,
- "r_x2": 532.0,
- "r_y2": 313.0,
- "r_x3": 532.0,
- "r_y3": 285.66666666666663,
+ "r_x0": 459.0,
+ "r_y0": 429.3333333333333,
+ "r_x1": 459.0,
+ "r_y1": 499.3333333333333,
+ "r_x2": 475.0,
+ "r_y2": 499.3333333333333,
+ "r_x3": 475.0,
+ "r_y3": 429.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "some",
- "orig": "some",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9615657,
+ "confidence": 94.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 13,
+ "label": "text",
+ "bbox": {
+ "l": 408.0,
+ "t": 408.3333333333333,
+ "r": 424.0,
+ "b": 514.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 12,
"rgba": {
@@ -3475,36 +3594,36 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 317.0,
- "r_x1": 525.6666666666666,
- "r_y1": 333.0,
- "r_x2": 534.3333333333334,
- "r_y2": 333.0,
- "r_x3": 534.3333333333334,
- "r_y3": 317.0,
+ "r_x0": 408.0,
+ "r_y0": 408.3333333333333,
+ "r_x1": 408.0,
+ "r_y1": 514.0,
+ "r_x2": 424.0,
+ "r_y2": 514.0,
+ "r_x3": 424.0,
+ "r_y3": 408.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "cell",
- "orig": "cell",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.95838455,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 7,
+ "id": 14,
"label": "text",
"bbox": {
- "l": 525.6666666666666,
- "t": 398.3333333333333,
- "r": 534.3333333333334,
- "b": 463.0,
+ "l": 376.0,
+ "t": 440.6666666666667,
+ "r": 392.0,
+ "b": 487.6666666666667,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7514549493789673,
+ "confidence": 96.0,
"cells": [
{
"index": 13,
@@ -3515,22 +3634,37 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 398.3333333333333,
- "r_x1": 525.6666666666666,
- "r_y1": 422.0,
- "r_x2": 534.3333333333334,
- "r_y2": 422.0,
- "r_x3": 534.3333333333334,
- "r_y3": 398.3333333333333,
+ "r_x0": 376.0,
+ "r_y0": 440.6666666666667,
+ "r_x1": 376.0,
+ "r_y1": 487.6666666666667,
+ "r_x2": 392.0,
+ "r_y2": 487.6666666666667,
+ "r_x3": 392.0,
+ "r_y3": 440.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9642998500000001,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 15,
+ "label": "text",
+ "bbox": {
+ "l": 328.0,
+ "t": 408.3333333333333,
+ "r": 344.0,
+ "b": 514.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 14,
"rgba": {
@@ -3540,36 +3674,36 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 426.0,
- "r_x1": 525.6666666666666,
- "r_y1": 463.0,
- "r_x2": 534.0,
- "r_y2": 463.0,
- "r_x3": 534.0,
- "r_y3": 426.0,
+ "r_x0": 328.0,
+ "r_y0": 408.3333333333333,
+ "r_x1": 328.0,
+ "r_y1": 514.0,
+ "r_x2": 344.0,
+ "r_y2": 514.0,
+ "r_x3": 344.0,
+ "r_y3": 408.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "content",
- "orig": "content",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.96576363,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 4,
+ "id": 16,
"label": "text",
"bbox": {
- "l": 479.3333333333333,
- "t": 160.33333333333334,
- "r": 488.0,
- "b": 240.33333333333331,
+ "l": 296.6666666666667,
+ "t": 440.6666666666667,
+ "r": 312.6666666666667,
+ "b": 487.6666666666667,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.769959032535553,
+ "confidence": 95.0,
"cells": [
{
"index": 15,
@@ -3580,135 +3714,20 @@
"a": 255
},
"rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 160.33333333333334,
- "r_x1": 479.3333333333333,
- "r_y1": 189.33333333333331,
- "r_x2": 488.0,
- "r_y2": 189.33333333333331,
- "r_x3": 488.0,
- "r_y3": 160.33333333333334,
+ "r_x0": 296.6666666666667,
+ "r_y0": 440.6666666666667,
+ "r_x1": 296.6666666666667,
+ "r_y1": 487.6666666666667,
+ "r_x2": 312.6666666666667,
+ "r_y2": 487.6666666666667,
+ "r_x3": 312.6666666666667,
+ "r_y3": 440.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96371613,
- "from_ocr": true
- },
- {
- "index": 16,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 193.33333333333331,
- "r_x1": 479.3333333333333,
- "r_y1": 219.0,
- "r_x2": 488.0,
- "r_y2": 219.0,
- "r_x3": 488.0,
- "r_y3": 193.33333333333331,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.9634315499999999,
- "from_ocr": true
- },
- {
- "index": 17,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 222.66666666666669,
- "r_x1": 479.3333333333333,
- "r_y1": 240.33333333333331,
- "r_x2": 485.6666666666667,
- "r_y2": 240.33333333333331,
- "r_x3": 485.6666666666667,
- "r_y3": 222.66666666666669,
- "coord_origin": "TOPLEFT"
- },
- "text": "row",
- "orig": "row",
- "text_direction": "left_to_right",
- "confidence": 0.9611644699999999,
- "from_ocr": true
- }
- ],
- "children": []
- },
- {
- "id": 5,
- "label": "text",
- "bbox": {
- "l": 479.3333333333333,
- "t": 283.0,
- "r": 488.0,
- "b": 336.33333333333337,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.7653545141220093,
- "cells": [
- {
- "index": 18,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 283.0,
- "r_x1": 479.3333333333333,
- "r_y1": 309.0,
- "r_x2": 487.6666666666667,
- "r_y2": 309.0,
- "r_x3": 487.6666666666667,
- "r_y3": 283.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.95751617,
- "from_ocr": true
- },
- {
- "index": 19,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 312.33333333333337,
- "r_x1": 479.3333333333333,
- "r_y1": 336.33333333333337,
- "r_x2": 488.0,
- "r_y2": 336.33333333333337,
- "r_x3": 488.0,
- "r_y3": 312.33333333333337,
- "coord_origin": "TOPLEFT"
- },
- "text": "don't",
- "orig": "don't",
- "text_direction": "left_to_right",
- "confidence": 0.9581434600000001,
+ "confidence": 95.0,
"from_ocr": true
}
],
@@ -3718,40 +3737,98 @@
},
"text": null,
"otsl_seq": [
- "ecel",
+ "ched",
"ched",
"ched",
"nl",
- "rhed",
+ "fcel",
"fcel",
"fcel",
"nl",
- "rhed",
"fcel",
- "ecel",
+ "fcel",
+ "fcel",
"nl"
],
- "num_rows": 0,
- "num_cols": 0,
- "table_cells": []
+ "num_rows": 1,
+ "num_cols": 3,
+ "table_cells": [
+ {
+ "bbox": {
+ "l": 443.33333333333337,
+ "t": 312.0,
+ "r": 490.33333333333337,
+ "b": 328.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 262.3333333333333,
+ "t": 296.6666666666667,
+ "r": 365.0,
+ "b": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Some other value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 98.0,
+ "t": 296.6666666666667,
+ "r": 203.66666666666669,
+ "b": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 0,
+ "end_col_offset_idx": 1,
+ "text": "Yet another value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ }
+ ]
}
],
"body": [
{
- "label": "section_header",
- "id": 8,
+ "label": "table",
+ "id": 0,
"page_no": 0,
"cluster": {
- "id": 8,
- "label": "section_header",
+ "id": 0,
+ "label": "table",
"bbox": {
- "l": 690.10272,
- "t": 201.26337,
- "r": 719.1490499999999,
- "b": 417.96024,
+ "l": 277.4178771972656,
+ "t": 69.0385971069336,
+ "r": 524.3541717529297,
+ "b": 551.0978393554688,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7426818609237671,
+ "confidence": 0.9790208339691162,
"cells": [
{
"index": 0,
@@ -3762,43 +3839,22 @@
"a": 255
},
"rect": {
- "r_x0": 690.10272,
- "r_y0": 417.96024,
- "r_x1": 719.1490499999999,
- "r_y1": 417.96024,
- "r_x2": 719.1490499999999,
- "r_y2": 201.26337,
- "r_x3": 690.10272,
- "r_y3": 201.26337,
+ "r_x0": 485.66666666666663,
+ "r_y0": 97.33333333333333,
+ "r_x1": 485.66666666666663,
+ "r_y1": 190.0,
+ "r_x2": 506.3333333333333,
+ "r_y2": 190.0,
+ "r_x3": 506.3333333333333,
+ "r_y3": 97.33333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "This is a table test ",
- "orig": "This is a table test ",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- }
- ],
- "children": []
- },
- "text": "This is a table test"
- },
- {
- "label": "picture",
- "id": 13,
- "page_no": 0,
- "cluster": {
- "id": 13,
- "label": "picture",
- "bbox": {
- "l": 668.9778442382812,
- "t": 70.57099151611328,
- "r": 683.4164962768555,
- "b": 79.46605682373047,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.5229994654655457,
- "cells": [
+ "confidence": 89.0,
+ "from_ocr": true
+ },
{
"index": 1,
"rgba": {
@@ -3808,88 +3864,22 @@
"a": 255
},
"rect": {
- "r_x0": 669.96899,
- "r_y0": 78.71936000000005,
- "r_x1": 682.25806,
- "r_y1": 78.71936000000005,
- "r_x2": 682.25806,
- "r_y2": 71.99987999999996,
- "r_x3": 669.96899,
- "r_y3": 71.99987999999996,
+ "r_x0": 454.33333333333337,
+ "r_y0": 112.0,
+ "r_x1": 454.33333333333337,
+ "r_y1": 182.33333333333334,
+ "r_x2": 475.0,
+ "r_y2": 182.33333333333334,
+ "r_x3": 475.0,
+ "r_y3": 112.0,
"coord_origin": "TOPLEFT"
},
- "text": " T",
- "orig": " T",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- }
- ],
- "children": [
- {
- "id": 20,
- "label": "text",
- "bbox": {
- "l": 669.96899,
- "t": 71.99987999999996,
- "r": 682.25806,
- "b": 78.71936000000005,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 1.0,
- "cells": [
- {
- "index": 1,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 669.96899,
- "r_y0": 78.71936000000005,
- "r_x1": 682.25806,
- "r_y1": 78.71936000000005,
- "r_x2": 682.25806,
- "r_y2": 71.99987999999996,
- "r_x3": 669.96899,
- "r_y3": 71.99987999999996,
- "coord_origin": "TOPLEFT"
- },
- "text": " T",
- "orig": " T",
- "text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- }
- ],
- "children": []
- }
- ]
- },
- "text": "",
- "annotations": [],
- "provenance": null,
- "predicted_class": null,
- "confidence": null
- },
- {
- "label": "text",
- "id": 0,
- "page_no": 0,
- "cluster": {
- "id": 0,
- "label": "text",
- "bbox": {
- "l": 640.87671,
- "t": 78.71447999999998,
- "r": 653.16504,
- "b": 376.27319,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.8302523493766785,
- "cells": [
+ "confidence": 92.0,
+ "from_ocr": true
+ },
{
"index": 2,
"rgba": {
@@ -3899,43 +3889,47 @@
"a": 255
},
"rect": {
- "r_x0": 640.87671,
- "r_y0": 376.27319,
- "r_x1": 653.16504,
- "r_y1": 376.27319,
- "r_x2": 653.16504,
- "r_y2": 78.71447999999998,
- "r_x3": 640.87671,
- "r_y3": 78.71447999999998,
+ "r_x0": 392.0,
+ "r_y0": 121.66666666666667,
+ "r_x1": 392.0,
+ "r_y1": 168.66666666666666,
+ "r_x2": 408.0,
+ "r_y2": 168.66666666666666,
+ "r_x3": 408.0,
+ "r_y3": 121.66666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "heteststartswithsomerandomtextandthenatableimage: ",
- "orig": "heteststartswithsomerandomtextandthenatableimage: ",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- }
- ],
- "children": []
- },
- "text": "heteststartswithsomerandomtextandthenatableimage:"
- },
- {
- "label": "table",
- "id": 11,
- "page_no": 0,
- "cluster": {
- "id": 11,
- "label": "table",
- "bbox": {
- "l": 460.5577697753906,
- "t": 142.614013671875,
- "r": 599.0364074707031,
- "b": 499.7825622558594,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.5623787045478821,
- "cells": [
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 3,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 312.0,
+ "r_y0": 121.66666666666667,
+ "r_x1": 312.0,
+ "r_y1": 168.66666666666666,
+ "r_x2": 328.0,
+ "r_y2": 168.66666666666666,
+ "r_x3": 328.0,
+ "r_y3": 121.66666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ },
{
"index": 4,
"rgba": {
@@ -3945,20 +3939,20 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 275.0,
- "r_x1": 572.0,
- "r_y1": 304.0,
- "r_x2": 580.6666666666666,
- "r_y2": 304.0,
- "r_x3": 580.6666666666666,
- "r_y3": 275.0,
+ "r_x0": 485.66666666666663,
+ "r_y0": 232.66666666666666,
+ "r_x1": 485.66666666666663,
+ "r_y1": 364.0,
+ "r_x2": 506.3333333333333,
+ "r_y2": 364.0,
+ "r_x3": 506.3333333333333,
+ "r_y3": 232.66666666666666,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 0.95741158,
+ "confidence": 92.0,
"from_ocr": true
},
{
@@ -3970,20 +3964,20 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 308.0,
- "r_x1": 572.0,
- "r_y1": 343.66666666666663,
- "r_x2": 580.3333333333334,
- "r_y2": 343.66666666666663,
- "r_x3": 580.3333333333334,
- "r_y3": 308.0,
+ "r_x0": 459.0,
+ "r_y0": 265.66666666666663,
+ "r_x1": 459.0,
+ "r_y1": 336.0,
+ "r_x2": 475.0,
+ "r_y2": 336.0,
+ "r_x3": 475.0,
+ "r_y3": 265.66666666666663,
"coord_origin": "TOPLEFT"
},
"text": "column",
"orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9541709899999999,
+ "confidence": 94.0,
"from_ocr": true
},
{
@@ -3995,20 +3989,20 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 381.3333333333333,
- "r_x1": 572.0,
- "r_y1": 410.3333333333333,
- "r_x2": 580.6666666666666,
- "r_y2": 410.3333333333333,
- "r_x3": 580.6666666666666,
- "r_y3": 381.3333333333333,
+ "r_x0": 408.0,
+ "r_y0": 247.0,
+ "r_x1": 408.0,
+ "r_y1": 349.6666666666667,
+ "r_x2": 424.0,
+ "r_y2": 349.6666666666667,
+ "r_x3": 424.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.96515053,
+ "confidence": 89.0,
"from_ocr": true
},
{
@@ -4020,20 +4014,20 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 414.3333333333333,
- "r_x1": 572.0,
- "r_y1": 440.3333333333333,
- "r_x2": 580.3333333333334,
- "r_y2": 440.3333333333333,
- "r_x3": 580.3333333333334,
- "r_y3": 414.3333333333333,
+ "r_x0": 376.0,
+ "r_y0": 277.0,
+ "r_x1": 376.0,
+ "r_y1": 324.3333333333333,
+ "r_x2": 392.0,
+ "r_y2": 324.3333333333333,
+ "r_x3": 392.0,
+ "r_y3": 277.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9623101,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -4045,20 +4039,20 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 443.3333333333333,
- "r_x1": 572.0,
- "r_y1": 479.3333333333333,
- "r_x2": 580.3333333333334,
- "r_y2": 479.3333333333333,
- "r_x3": 580.3333333333334,
- "r_y3": 443.3333333333333,
+ "r_x0": 328.0,
+ "r_y0": 247.0,
+ "r_x1": 328.0,
+ "r_y1": 349.6666666666667,
+ "r_x2": 344.0,
+ "r_y2": 349.6666666666667,
+ "r_x3": 344.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.94704376,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -4070,20 +4064,20 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 175.0,
- "r_x1": 525.6666666666666,
- "r_y1": 204.0,
- "r_x2": 534.3333333333334,
- "r_y2": 204.0,
- "r_x3": 534.3333333333334,
- "r_y3": 175.0,
+ "r_x0": 296.6666666666667,
+ "r_y0": 277.33333333333337,
+ "r_x1": 296.6666666666667,
+ "r_y1": 324.3333333333333,
+ "r_x2": 312.6666666666667,
+ "r_y2": 324.3333333333333,
+ "r_x3": 312.6666666666667,
+ "r_y3": 277.33333333333337,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96139633,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -4095,20 +4089,20 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 208.0,
- "r_x1": 525.6666666666666,
- "r_y1": 225.66666666666669,
- "r_x2": 532.0,
- "r_y2": 225.66666666666669,
- "r_x3": 532.0,
- "r_y3": 208.0,
+ "r_x0": 490.33333333333337,
+ "r_y0": 406.3333333333333,
+ "r_x1": 490.33333333333337,
+ "r_y1": 518.3333333333333,
+ "r_x2": 506.3333333333333,
+ "r_y2": 518.3333333333333,
+ "r_x3": 506.3333333333333,
+ "r_y3": 406.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.9561322,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -4120,20 +4114,20 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 285.66666666666663,
- "r_x1": 525.6666666666666,
- "r_y1": 313.0,
- "r_x2": 532.0,
- "r_y2": 313.0,
- "r_x3": 532.0,
- "r_y3": 285.66666666666663,
+ "r_x0": 459.0,
+ "r_y0": 429.3333333333333,
+ "r_x1": 459.0,
+ "r_y1": 499.3333333333333,
+ "r_x2": 475.0,
+ "r_y2": 499.3333333333333,
+ "r_x3": 475.0,
+ "r_y3": 429.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "some",
- "orig": "some",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9615657,
+ "confidence": 94.0,
"from_ocr": true
},
{
@@ -4145,20 +4139,20 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 317.0,
- "r_x1": 525.6666666666666,
- "r_y1": 333.0,
- "r_x2": 534.3333333333334,
- "r_y2": 333.0,
- "r_x3": 534.3333333333334,
- "r_y3": 317.0,
+ "r_x0": 408.0,
+ "r_y0": 408.3333333333333,
+ "r_x1": 408.0,
+ "r_y1": 514.0,
+ "r_x2": 424.0,
+ "r_y2": 514.0,
+ "r_x3": 424.0,
+ "r_y3": 408.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "cell",
- "orig": "cell",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.95838455,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -4170,20 +4164,20 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 398.3333333333333,
- "r_x1": 525.6666666666666,
- "r_y1": 422.0,
- "r_x2": 534.3333333333334,
- "r_y2": 422.0,
- "r_x3": 534.3333333333334,
- "r_y3": 398.3333333333333,
+ "r_x0": 376.0,
+ "r_y0": 440.6666666666667,
+ "r_x1": 376.0,
+ "r_y1": 487.6666666666667,
+ "r_x2": 392.0,
+ "r_y2": 487.6666666666667,
+ "r_x3": 392.0,
+ "r_y3": 440.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9642998500000001,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -4195,20 +4189,20 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 426.0,
- "r_x1": 525.6666666666666,
- "r_y1": 463.0,
- "r_x2": 534.0,
- "r_y2": 463.0,
- "r_x3": 534.0,
- "r_y3": 426.0,
+ "r_x0": 328.0,
+ "r_y0": 408.3333333333333,
+ "r_x1": 328.0,
+ "r_y1": 514.0,
+ "r_x2": 344.0,
+ "r_y2": 514.0,
+ "r_x3": 344.0,
+ "r_y3": 408.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "content",
- "orig": "content",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.96576363,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -4220,135 +4214,195 @@
"a": 255
},
"rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 160.33333333333334,
- "r_x1": 479.3333333333333,
- "r_y1": 189.33333333333331,
- "r_x2": 488.0,
- "r_y2": 189.33333333333331,
- "r_x3": 488.0,
- "r_y3": 160.33333333333334,
+ "r_x0": 296.6666666666667,
+ "r_y0": 440.6666666666667,
+ "r_x1": 296.6666666666667,
+ "r_y1": 487.6666666666667,
+ "r_x2": 312.6666666666667,
+ "r_y2": 487.6666666666667,
+ "r_x3": 312.6666666666667,
+ "r_y3": 440.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96371613,
- "from_ocr": true
- },
- {
- "index": 16,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 193.33333333333331,
- "r_x1": 479.3333333333333,
- "r_y1": 219.0,
- "r_x2": 488.0,
- "r_y2": 219.0,
- "r_x3": 488.0,
- "r_y3": 193.33333333333331,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.9634315499999999,
- "from_ocr": true
- },
- {
- "index": 17,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 222.66666666666669,
- "r_x1": 479.3333333333333,
- "r_y1": 240.33333333333331,
- "r_x2": 485.6666666666667,
- "r_y2": 240.33333333333331,
- "r_x3": 485.6666666666667,
- "r_y3": 222.66666666666669,
- "coord_origin": "TOPLEFT"
- },
- "text": "row",
- "orig": "row",
- "text_direction": "left_to_right",
- "confidence": 0.9611644699999999,
- "from_ocr": true
- },
- {
- "index": 18,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 283.0,
- "r_x1": 479.3333333333333,
- "r_y1": 309.0,
- "r_x2": 487.6666666666667,
- "r_y2": 309.0,
- "r_x3": 487.6666666666667,
- "r_y3": 283.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.95751617,
- "from_ocr": true
- },
- {
- "index": 19,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 312.33333333333337,
- "r_x1": 479.3333333333333,
- "r_y1": 336.33333333333337,
- "r_x2": 488.0,
- "r_y2": 336.33333333333337,
- "r_x3": 488.0,
- "r_y3": 312.33333333333337,
- "coord_origin": "TOPLEFT"
- },
- "text": "don't",
- "orig": "don't",
- "text_direction": "left_to_right",
- "confidence": 0.9581434600000001,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": [
+ {
+ "id": 1,
+ "label": "text",
+ "bbox": {
+ "l": 485.66666666666663,
+ "t": 97.33333333333333,
+ "r": 506.3333333333333,
+ "b": 190.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 89.0,
+ "cells": [
+ {
+ "index": 0,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 485.66666666666663,
+ "r_y0": 97.33333333333333,
+ "r_x1": 485.66666666666663,
+ "r_y1": 190.0,
+ "r_x2": 506.3333333333333,
+ "r_y2": 190.0,
+ "r_x3": 506.3333333333333,
+ "r_y3": 97.33333333333333,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Vertically",
+ "orig": "Vertically",
+ "text_direction": "left_to_right",
+ "confidence": 89.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 2,
+ "label": "text",
+ "bbox": {
+ "l": 454.33333333333337,
+ "t": 112.0,
+ "r": 475.0,
+ "b": 182.33333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 92.0,
+ "cells": [
+ {
+ "index": 1,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 454.33333333333337,
+ "r_y0": 112.0,
+ "r_x1": 454.33333333333337,
+ "r_y1": 182.33333333333334,
+ "r_x2": 475.0,
+ "r_y2": 182.33333333333334,
+ "r_x3": 475.0,
+ "r_y3": 112.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "merged",
+ "orig": "merged",
+ "text_direction": "left_to_right",
+ "confidence": 92.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
{
"id": 3,
"label": "text",
"bbox": {
- "l": 572.0,
- "t": 275.0,
- "r": 580.6666666666666,
- "b": 343.66666666666663,
+ "l": 392.0,
+ "t": 121.66666666666667,
+ "r": 408.0,
+ "b": 168.66666666666666,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7740143537521362,
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 2,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 392.0,
+ "r_y0": 121.66666666666667,
+ "r_x1": 392.0,
+ "r_y1": 168.66666666666666,
+ "r_x2": 408.0,
+ "r_y2": 168.66666666666666,
+ "r_x3": 408.0,
+ "r_y3": 121.66666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 4,
+ "label": "text",
+ "bbox": {
+ "l": 312.0,
+ "t": 121.66666666666667,
+ "r": 328.0,
+ "b": 168.66666666666666,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
+ {
+ "index": 3,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 312.0,
+ "r_y0": 121.66666666666667,
+ "r_x1": 312.0,
+ "r_y1": 168.66666666666666,
+ "r_x2": 328.0,
+ "r_y2": 168.66666666666666,
+ "r_x3": 328.0,
+ "r_y3": 121.66666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 5,
+ "label": "text",
+ "bbox": {
+ "l": 485.66666666666663,
+ "t": 232.66666666666666,
+ "r": 506.3333333333333,
+ "b": 364.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 92.0,
"cells": [
{
"index": 4,
@@ -4359,22 +4413,37 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 275.0,
- "r_x1": 572.0,
- "r_y1": 304.0,
- "r_x2": 580.6666666666666,
- "r_y2": 304.0,
- "r_x3": 580.6666666666666,
- "r_y3": 275.0,
+ "r_x0": 485.66666666666663,
+ "r_y0": 232.66666666666666,
+ "r_x1": 485.66666666666663,
+ "r_y1": 364.0,
+ "r_x2": 506.3333333333333,
+ "r_y2": 364.0,
+ "r_x3": 506.3333333333333,
+ "r_y3": 232.66666666666666,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 0.95741158,
+ "confidence": 92.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 6,
+ "label": "text",
+ "bbox": {
+ "l": 459.0,
+ "t": 265.66666666666663,
+ "r": 475.0,
+ "b": 336.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
{
"index": 5,
"rgba": {
@@ -4384,36 +4453,36 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 308.0,
- "r_x1": 572.0,
- "r_y1": 343.66666666666663,
- "r_x2": 580.3333333333334,
- "r_y2": 343.66666666666663,
- "r_x3": 580.3333333333334,
- "r_y3": 308.0,
+ "r_x0": 459.0,
+ "r_y0": 265.66666666666663,
+ "r_x1": 459.0,
+ "r_y1": 336.0,
+ "r_x2": 475.0,
+ "r_y2": 336.0,
+ "r_x3": 475.0,
+ "r_y3": 265.66666666666663,
"coord_origin": "TOPLEFT"
},
"text": "column",
"orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9541709899999999,
+ "confidence": 94.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 1,
+ "id": 7,
"label": "text",
"bbox": {
- "l": 572.0,
- "t": 381.3333333333333,
- "r": 580.6666666666666,
- "b": 479.3333333333333,
+ "l": 408.0,
+ "t": 247.0,
+ "r": 424.0,
+ "b": 349.6666666666667,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7769111394882202,
+ "confidence": 89.0,
"cells": [
{
"index": 6,
@@ -4424,22 +4493,37 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 381.3333333333333,
- "r_x1": 572.0,
- "r_y1": 410.3333333333333,
- "r_x2": 580.6666666666666,
- "r_y2": 410.3333333333333,
- "r_x3": 580.6666666666666,
- "r_y3": 381.3333333333333,
+ "r_x0": 408.0,
+ "r_y0": 247.0,
+ "r_x1": 408.0,
+ "r_y1": 349.6666666666667,
+ "r_x2": 424.0,
+ "r_y2": 349.6666666666667,
+ "r_x3": 424.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.96515053,
+ "confidence": 89.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 8,
+ "label": "text",
+ "bbox": {
+ "l": 376.0,
+ "t": 277.0,
+ "r": 392.0,
+ "b": 324.3333333333333,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
{
"index": 7,
"rgba": {
@@ -4449,22 +4533,37 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 414.3333333333333,
- "r_x1": 572.0,
- "r_y1": 440.3333333333333,
- "r_x2": 580.3333333333334,
- "r_y2": 440.3333333333333,
- "r_x3": 580.3333333333334,
- "r_y3": 414.3333333333333,
+ "r_x0": 376.0,
+ "r_y0": 277.0,
+ "r_x1": 376.0,
+ "r_y1": 324.3333333333333,
+ "r_x2": 392.0,
+ "r_y2": 324.3333333333333,
+ "r_x3": 392.0,
+ "r_y3": 277.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9623101,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 9,
+ "label": "text",
+ "bbox": {
+ "l": 328.0,
+ "t": 247.0,
+ "r": 344.0,
+ "b": 349.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 8,
"rgba": {
@@ -4474,36 +4573,36 @@
"a": 255
},
"rect": {
- "r_x0": 572.0,
- "r_y0": 443.3333333333333,
- "r_x1": 572.0,
- "r_y1": 479.3333333333333,
- "r_x2": 580.3333333333334,
- "r_y2": 479.3333333333333,
- "r_x3": 580.3333333333334,
- "r_y3": 443.3333333333333,
+ "r_x0": 328.0,
+ "r_y0": 247.0,
+ "r_x1": 328.0,
+ "r_y1": 349.6666666666667,
+ "r_x2": 344.0,
+ "r_y2": 349.6666666666667,
+ "r_x3": 344.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.94704376,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 6,
+ "id": 10,
"label": "text",
"bbox": {
- "l": 525.6666666666666,
- "t": 175.0,
- "r": 534.3333333333334,
- "b": 225.66666666666669,
+ "l": 296.6666666666667,
+ "t": 277.33333333333337,
+ "r": 312.6666666666667,
+ "b": 324.3333333333333,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7583935856819153,
+ "confidence": 96.0,
"cells": [
{
"index": 9,
@@ -4514,22 +4613,37 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 175.0,
- "r_x1": 525.6666666666666,
- "r_y1": 204.0,
- "r_x2": 534.3333333333334,
- "r_y2": 204.0,
- "r_x3": 534.3333333333334,
- "r_y3": 175.0,
+ "r_x0": 296.6666666666667,
+ "r_y0": 277.33333333333337,
+ "r_x1": 296.6666666666667,
+ "r_y1": 324.3333333333333,
+ "r_x2": 312.6666666666667,
+ "r_y2": 324.3333333333333,
+ "r_x3": 312.6666666666667,
+ "r_y3": 277.33333333333337,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96139633,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 11,
+ "label": "text",
+ "bbox": {
+ "l": 490.33333333333337,
+ "t": 406.3333333333333,
+ "r": 506.3333333333333,
+ "b": 518.3333333333333,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 10,
"rgba": {
@@ -4539,36 +4653,36 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 208.0,
- "r_x1": 525.6666666666666,
- "r_y1": 225.66666666666669,
- "r_x2": 532.0,
- "r_y2": 225.66666666666669,
- "r_x3": 532.0,
- "r_y3": 208.0,
+ "r_x0": 490.33333333333337,
+ "r_y0": 406.3333333333333,
+ "r_x1": 490.33333333333337,
+ "r_y1": 518.3333333333333,
+ "r_x2": 506.3333333333333,
+ "r_y2": 518.3333333333333,
+ "r_x3": 506.3333333333333,
+ "r_y3": 406.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.9561322,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 2,
+ "id": 12,
"label": "text",
"bbox": {
- "l": 525.6666666666666,
- "t": 285.66666666666663,
- "r": 534.3333333333334,
- "b": 333.0,
+ "l": 459.0,
+ "t": 429.3333333333333,
+ "r": 475.0,
+ "b": 499.3333333333333,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7750864028930664,
+ "confidence": 94.0,
"cells": [
{
"index": 11,
@@ -4579,22 +4693,37 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 285.66666666666663,
- "r_x1": 525.6666666666666,
- "r_y1": 313.0,
- "r_x2": 532.0,
- "r_y2": 313.0,
- "r_x3": 532.0,
- "r_y3": 285.66666666666663,
+ "r_x0": 459.0,
+ "r_y0": 429.3333333333333,
+ "r_x1": 459.0,
+ "r_y1": 499.3333333333333,
+ "r_x2": 475.0,
+ "r_y2": 499.3333333333333,
+ "r_x3": 475.0,
+ "r_y3": 429.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "some",
- "orig": "some",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9615657,
+ "confidence": 94.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 13,
+ "label": "text",
+ "bbox": {
+ "l": 408.0,
+ "t": 408.3333333333333,
+ "r": 424.0,
+ "b": 514.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 12,
"rgba": {
@@ -4604,36 +4733,36 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 317.0,
- "r_x1": 525.6666666666666,
- "r_y1": 333.0,
- "r_x2": 534.3333333333334,
- "r_y2": 333.0,
- "r_x3": 534.3333333333334,
- "r_y3": 317.0,
+ "r_x0": 408.0,
+ "r_y0": 408.3333333333333,
+ "r_x1": 408.0,
+ "r_y1": 514.0,
+ "r_x2": 424.0,
+ "r_y2": 514.0,
+ "r_x3": 424.0,
+ "r_y3": 408.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "cell",
- "orig": "cell",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.95838455,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 7,
+ "id": 14,
"label": "text",
"bbox": {
- "l": 525.6666666666666,
- "t": 398.3333333333333,
- "r": 534.3333333333334,
- "b": 463.0,
+ "l": 376.0,
+ "t": 440.6666666666667,
+ "r": 392.0,
+ "b": 487.6666666666667,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.7514549493789673,
+ "confidence": 96.0,
"cells": [
{
"index": 13,
@@ -4644,22 +4773,37 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 398.3333333333333,
- "r_x1": 525.6666666666666,
- "r_y1": 422.0,
- "r_x2": 534.3333333333334,
- "r_y2": 422.0,
- "r_x3": 534.3333333333334,
- "r_y3": 398.3333333333333,
+ "r_x0": 376.0,
+ "r_y0": 440.6666666666667,
+ "r_x1": 376.0,
+ "r_y1": 487.6666666666667,
+ "r_x2": 392.0,
+ "r_y2": 487.6666666666667,
+ "r_x3": 392.0,
+ "r_y3": 440.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9642998500000001,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 15,
+ "label": "text",
+ "bbox": {
+ "l": 328.0,
+ "t": 408.3333333333333,
+ "r": 344.0,
+ "b": 514.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 14,
"rgba": {
@@ -4669,36 +4813,36 @@
"a": 255
},
"rect": {
- "r_x0": 525.6666666666666,
- "r_y0": 426.0,
- "r_x1": 525.6666666666666,
- "r_y1": 463.0,
- "r_x2": 534.0,
- "r_y2": 463.0,
- "r_x3": 534.0,
- "r_y3": 426.0,
+ "r_x0": 328.0,
+ "r_y0": 408.3333333333333,
+ "r_x1": 328.0,
+ "r_y1": 514.0,
+ "r_x2": 344.0,
+ "r_y2": 514.0,
+ "r_x3": 344.0,
+ "r_y3": 408.3333333333333,
"coord_origin": "TOPLEFT"
},
- "text": "content",
- "orig": "content",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.96576363,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 4,
+ "id": 16,
"label": "text",
"bbox": {
- "l": 479.3333333333333,
- "t": 160.33333333333334,
- "r": 488.0,
- "b": 240.33333333333331,
+ "l": 296.6666666666667,
+ "t": 440.6666666666667,
+ "r": 312.6666666666667,
+ "b": 487.6666666666667,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.769959032535553,
+ "confidence": 95.0,
"cells": [
{
"index": 15,
@@ -4709,135 +4853,20 @@
"a": 255
},
"rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 160.33333333333334,
- "r_x1": 479.3333333333333,
- "r_y1": 189.33333333333331,
- "r_x2": 488.0,
- "r_y2": 189.33333333333331,
- "r_x3": 488.0,
- "r_y3": 160.33333333333334,
+ "r_x0": 296.6666666666667,
+ "r_y0": 440.6666666666667,
+ "r_x1": 296.6666666666667,
+ "r_y1": 487.6666666666667,
+ "r_x2": 312.6666666666667,
+ "r_y2": 487.6666666666667,
+ "r_x3": 312.6666666666667,
+ "r_y3": 440.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96371613,
- "from_ocr": true
- },
- {
- "index": 16,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 193.33333333333331,
- "r_x1": 479.3333333333333,
- "r_y1": 219.0,
- "r_x2": 488.0,
- "r_y2": 219.0,
- "r_x3": 488.0,
- "r_y3": 193.33333333333331,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.9634315499999999,
- "from_ocr": true
- },
- {
- "index": 17,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 222.66666666666669,
- "r_x1": 479.3333333333333,
- "r_y1": 240.33333333333331,
- "r_x2": 485.6666666666667,
- "r_y2": 240.33333333333331,
- "r_x3": 485.6666666666667,
- "r_y3": 222.66666666666669,
- "coord_origin": "TOPLEFT"
- },
- "text": "row",
- "orig": "row",
- "text_direction": "left_to_right",
- "confidence": 0.9611644699999999,
- "from_ocr": true
- }
- ],
- "children": []
- },
- {
- "id": 5,
- "label": "text",
- "bbox": {
- "l": 479.3333333333333,
- "t": 283.0,
- "r": 488.0,
- "b": 336.33333333333337,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.7653545141220093,
- "cells": [
- {
- "index": 18,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 283.0,
- "r_x1": 479.3333333333333,
- "r_y1": 309.0,
- "r_x2": 487.6666666666667,
- "r_y2": 309.0,
- "r_x3": 487.6666666666667,
- "r_y3": 283.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.95751617,
- "from_ocr": true
- },
- {
- "index": 19,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 479.3333333333333,
- "r_y0": 312.33333333333337,
- "r_x1": 479.3333333333333,
- "r_y1": 336.33333333333337,
- "r_x2": 488.0,
- "r_y2": 336.33333333333337,
- "r_x3": 488.0,
- "r_y3": 312.33333333333337,
- "coord_origin": "TOPLEFT"
- },
- "text": "don't",
- "orig": "don't",
- "text_direction": "left_to_right",
- "confidence": 0.9581434600000001,
+ "confidence": 95.0,
"from_ocr": true
}
],
@@ -4847,22 +4876,80 @@
},
"text": null,
"otsl_seq": [
- "ecel",
+ "ched",
"ched",
"ched",
"nl",
- "rhed",
+ "fcel",
"fcel",
"fcel",
"nl",
- "rhed",
"fcel",
- "ecel",
+ "fcel",
+ "fcel",
"nl"
],
- "num_rows": 0,
- "num_cols": 0,
- "table_cells": []
+ "num_rows": 1,
+ "num_cols": 3,
+ "table_cells": [
+ {
+ "bbox": {
+ "l": 443.33333333333337,
+ "t": 312.0,
+ "r": 490.33333333333337,
+ "b": 328.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 262.3333333333333,
+ "t": 296.6666666666667,
+ "r": 365.0,
+ "b": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Some other value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 98.0,
+ "t": 296.6666666666667,
+ "r": 203.66666666666669,
+ "b": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 0,
+ "end_col_offset_idx": 1,
+ "text": "Yet another value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ }
+ ]
}
],
"headers": []
diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_90.doctags.txt b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_90.doctags.txt
index 5a2c9878..a9e1d3bd 100644
--- a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_90.doctags.txt
+++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_90.doctags.txt
@@ -1,9 +1,5 @@
-
-Column 2andhaveinside
-Column 1have contentother
-Column 0some cellsnothing
-this is row 0and row 1and last row 2
+
\ No newline at end of file
diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_90.json b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_90.json
index 648e8fe1..ad27e476 100644
--- a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_90.json
+++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_90.json
@@ -27,13 +27,13 @@
"file-info": {
"filename": "ocr_test_rotated_90.pdf",
"filename-prov": null,
- "document-hash": "2fb20caf4f54c878a0b454b496010d92adc6ae1b7f10fbd9ba1ba26260f818a8",
+ "document-hash": "418ae4425f514f002bd4223ea3003c17f319cbeafd67801732d58f2bedb3bd91",
"#-pages": 1,
"collection-name": null,
"description": null,
"page-hashes": [
{
- "hash": "56c847ad7c5ab9f0346a325510af001ab66a9bb45f65ffc7bbfc60c929def7d2",
+ "hash": "36315c08dc861ecde4be6179d2f155da0519b93e0311c290f8db164f593d36d8",
"model": "default",
"page": 1
}
@@ -52,10 +52,10 @@
"prov": [
{
"bbox": [
- 75.13359832763672,
- 102.99908447265625,
- 361.18695068359375,
- 562.1403198242188
+ 87.64582824707031,
+ 69.0385971069336,
+ 334.5821228027344,
+ 551.0978393554688
],
"page": 1,
"span": [
@@ -68,415 +68,9 @@
"text": "",
"type": "table",
"payload": null,
- "#-cols": 4,
- "#-rows": 4,
- "data": [
- [
- {
- "bbox": [
- 105.0718660651769,
- 304.7354643560275,
- 119.73306194406335,
- 369.59883715876185
- ],
- "spans": [
- [
- 0,
- 0
- ]
- ],
- "text": "Column 2",
- "type": "body",
- "col": 0,
- "col-header": false,
- "col-span": [
- 0,
- 1
- ],
- "row": 0,
- "row-header": false,
- "row-span": [
- 0,
- 1
- ]
- },
- {
- "bbox": [
- 172.26899264661517,
- 324.3168597625203,
- 188.15195177751215,
- 352.46511670018316
- ],
- "spans": [
- [
- 0,
- 1
- ]
- ],
- "text": "and",
- "type": "body",
- "col": 1,
- "col-header": false,
- "col-span": [
- 1,
- 2
- ],
- "row": 0,
- "row-header": false,
- "row-span": [
- 0,
- 1
- ]
- },
- {
- "bbox": [
- 240.68788382926402,
- 321.869185135892,
- 256.570842960161,
- 356.13662847492196
- ],
- "spans": [
- [
- 0,
- 2
- ]
- ],
- "text": "have",
- "type": "body",
- "col": 2,
- "col-header": false,
- "col-span": [
- 2,
- 3
- ],
- "row": 0,
- "row-header": false,
- "row-span": [
- 0,
- 1
- ]
- },
- {
- "bbox": [
- 312.772072637728,
- 319.42151173034614,
- 326.21150018118874,
- 359.8081389276117
- ],
- "spans": [
- [
- 0,
- 3
- ]
- ],
- "text": "inside",
- "type": "body",
- "col": 3,
- "col-header": false,
- "col-span": [
- 3,
- 4
- ],
- "row": 0,
- "row-header": false,
- "row-span": [
- 0,
- 1
- ]
- }
- ],
- [
- {
- "bbox": [
- 105.0718660651769,
- 419.77616156495424,
- 119.73306194406335,
- 483.4156981046677
- ],
- "spans": [
- [
- 1,
- 0
- ]
- ],
- "text": "Column 1",
- "type": "body",
- "col": 0,
- "col-header": false,
- "col-span": [
- 0,
- 1
- ],
- "row": 1,
- "row-header": false,
- "row-span": [
- 1,
- 2
- ]
- },
- {
- "bbox": [
- 172.26898999097682,
- 408.7616301134671,
- 185.70842261785268,
- 495.6540658231026
- ],
- "spans": [
- [
- 1,
- 1
- ]
- ],
- "text": "have content",
- "type": "body",
- "col": 1,
- "col-header": false,
- "col-span": [
- 1,
- 2
- ],
- "row": 1,
- "row-header": false,
- "row-span": [
- 1,
- 2
- ]
- },
- {
- "bbox": [
- 240.68788377535307,
- 433.23837164942523,
- 255.34907711253194,
- 468.729651251476
- ],
- "spans": [
- [
- 1,
- 2
- ]
- ],
- "text": "other",
- "type": "body",
- "col": 2,
- "col-header": false,
- "col-span": [
- 2,
- 3
- ],
- "row": 1,
- "row-header": false,
- "row-span": [
- 1,
- 2
- ]
- },
- {
- "bbox": null,
- "spans": [
- [
- 1,
- 3
- ]
- ],
- "text": "",
- "type": "body"
- }
- ],
- [
- {
- "bbox": [
- 105.07186605295925,
- 532.3691850430223,
- 119.73306193184567,
- 597.2325578457567
- ],
- "spans": [
- [
- 2,
- 0
- ]
- ],
- "text": "Column 0",
- "type": "body",
- "col": 0,
- "col-header": false,
- "col-span": [
- 0,
- 1
- ],
- "row": 2,
- "row-header": false,
- "row-span": [
- 2,
- 3
- ]
- },
- {
- "bbox": [
- 172.26899069197702,
- 529.9215107729757,
- 186.93018720629036,
- 600.9040699770771
- ],
- "spans": [
- [
- 2,
- 1
- ]
- ],
- "text": "some cells",
- "type": "body",
- "col": 1,
- "col-header": false,
- "col-span": [
- 1,
- 2
- ],
- "row": 2,
- "row-header": false,
- "row-span": [
- 2,
- 3
- ]
- },
- {
- "bbox": null,
- "spans": [
- [
- 2,
- 2
- ]
- ],
- "text": "",
- "type": "body"
- },
- {
- "bbox": [
- 311.49999737299976,
- 536.775000315586,
- 332.5000022770002,
- 592.9083316144141
- ],
- "spans": [
- [
- 2,
- 3
- ]
- ],
- "text": "nothing",
- "type": "body",
- "col": 3,
- "col-header": false,
- "col-span": [
- 3,
- 4
- ],
- "row": 2,
- "row-header": false,
- "row-span": [
- 2,
- 3
- ]
- }
- ],
- [
- {
- "bbox": null,
- "spans": [
- [
- 3,
- 0
- ]
- ],
- "text": "",
- "type": "body"
- },
- {
- "bbox": [
- 172.2689900422697,
- 638.8430233885732,
- 186.93018846286373,
- 719.6162777831045
- ],
- "spans": [
- [
- 3,
- 1
- ]
- ],
- "text": "this is row 0",
- "type": "body",
- "col": 1,
- "col-header": false,
- "col-span": [
- 1,
- 2
- ],
- "row": 3,
- "row-header": false,
- "row-span": [
- 3,
- 4
- ]
- },
- {
- "bbox": [
- 240.68788248006402,
- 647.4098827174411,
- 255.34907835895044,
- 712.2732555201754
- ],
- "spans": [
- [
- 3,
- 2
- ]
- ],
- "text": "and row 1",
- "type": "body",
- "col": 2,
- "col-header": false,
- "col-span": [
- 2,
- 3
- ],
- "row": 3,
- "row-header": false,
- "row-span": [
- 3,
- 4
- ]
- },
- {
- "bbox": [
- 313.9938353514431,
- 633.9476737903873,
- 327.43326861374595,
- 725.735464724632
- ],
- "spans": [
- [
- 3,
- 3
- ]
- ],
- "text": "and last row 2",
- "type": "body",
- "col": 3,
- "col-header": false,
- "col-span": [
- 3,
- 4
- ],
- "row": 3,
- "row-header": false,
- "row-span": [
- 3,
- 4
- ]
- }
- ]
- ],
+ "#-cols": 0,
+ "#-rows": 0,
+ "data": [],
"model": null,
"bounding-box": null
}
@@ -486,9 +80,9 @@
"footnotes": [],
"page-dimensions": [
{
- "height": 842.0,
+ "height": 792.0,
"page": 1,
- "width": 595.0
+ "width": 612.0
}
],
"page-footers": [],
diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_90.md b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_90.md
index a45b3c36..e69de29b 100644
--- a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_90.md
+++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_90.md
@@ -1,5 +0,0 @@
-| Column 2 | and | have | inside |
-|------------|---------------|-----------|----------------|
-| Column 1 | have content | other | |
-| Column 0 | some cells | | nothing |
-| | this is row 0 | and row 1 | and last row 2 |
\ No newline at end of file
diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_90.pages.json b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_90.pages.json
index b9d55049..c26e2ec8 100644
--- a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_90.pages.json
+++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_90.pages.json
@@ -2,8 +2,8 @@
{
"page_no": 0,
"size": {
- "width": 792.0,
- "height": 612.0
+ "width": 612.0,
+ "height": 792.0
},
"parsed_page": {
"dimension": {
@@ -11,47 +11,47 @@
"rect": {
"r_x0": 0.0,
"r_y0": 0.0,
- "r_x1": 612.0,
+ "r_x1": 792.0,
"r_y1": 0.0,
- "r_x2": 612.0,
- "r_y2": 792.0,
+ "r_x2": 792.0,
+ "r_y2": 612.0,
"r_x3": 0.0,
- "r_y3": 792.0,
+ "r_y3": 612.0,
"coord_origin": "BOTTOMLEFT"
},
"boundary_type": "crop_box",
"art_bbox": {
"l": 0.0,
- "t": 792.0,
- "r": 612.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
},
"bleed_bbox": {
"l": 0.0,
- "t": 792.0,
- "r": 612.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
},
"crop_bbox": {
"l": 0.0,
- "t": 792.0,
- "r": 612.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
},
"media_bbox": {
"l": 0.0,
- "t": 792.0,
- "r": 612.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
},
"trim_bbox": {
"l": 0.0,
- "t": 792.0,
- "r": 612.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
}
@@ -69,21 +69,21 @@
"a": 255
},
"rect": {
- "r_x0": 72.850723,
- "r_y0": 410.7366,
- "r_x1": 101.89737999999998,
- "r_y1": 410.7366,
- "r_x2": 101.89737999999998,
- "r_y2": 194.03978999999998,
- "r_x3": 72.850723,
- "r_y3": 194.03978999999998,
+ "r_x0": 126.33333333333334,
+ "r_y0": 694.6666666666666,
+ "r_x1": 126.33333333333334,
+ "r_y1": 602.0,
+ "r_x2": 105.66666666666666,
+ "r_y2": 602.0,
+ "r_x3": 105.66666666666666,
+ "r_y3": 694.6666666666666,
"coord_origin": "TOPLEFT"
},
- "text": "This is a table test ",
- "orig": "This is a table test ",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
},
{
"index": 1,
@@ -94,21 +94,21 @@
"a": 255
},
"rect": {
- "r_x0": 124.28839,
- "r_y0": 540.000015,
- "r_x1": 136.57715,
- "r_y1": 540.000015,
- "r_x2": 136.57715,
- "r_y2": 235.72681,
- "r_x3": 124.28839,
- "r_y3": 235.72681,
+ "r_x0": 157.66666666666669,
+ "r_y0": 680.3333333333334,
+ "r_x1": 157.66666666666669,
+ "r_y1": 610.0,
+ "r_x2": 137.0,
+ "r_y2": 610.0,
+ "r_x3": 137.0,
+ "r_y3": 680.3333333333334,
"coord_origin": "TOPLEFT"
},
- "text": "Theteststartswithsomerandomtextandthenatableimage: ",
- "orig": "Theteststartswithsomerandomtextandthenatableimage: ",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 2,
@@ -119,20 +119,20 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 337.0,
- "r_x1": 191.0,
- "r_y1": 308.0,
- "r_x2": 182.33333333333334,
- "r_y2": 308.0,
- "r_x3": 182.33333333333334,
- "r_y3": 337.0,
+ "r_x0": 220.0,
+ "r_y0": 670.3333333333334,
+ "r_x1": 220.0,
+ "r_y1": 623.3333333333334,
+ "r_x2": 204.0,
+ "r_y2": 623.3333333333334,
+ "r_x3": 204.0,
+ "r_y3": 670.3333333333334,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9576889799999999,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -144,20 +144,20 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 304.0,
- "r_x1": 191.0,
- "r_y1": 268.33333333333337,
- "r_x2": 182.33333333333334,
- "r_y2": 268.33333333333337,
- "r_x3": 182.33333333333334,
- "r_y3": 304.0,
+ "r_x0": 300.0,
+ "r_y0": 670.3333333333334,
+ "r_x1": 300.0,
+ "r_y1": 623.3333333333334,
+ "r_x2": 284.0,
+ "r_y2": 623.3333333333334,
+ "r_x3": 284.0,
+ "r_y3": 670.3333333333334,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9576889799999999,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -169,20 +169,20 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 230.66666666666666,
- "r_x1": 191.0,
- "r_y1": 201.66666666666669,
- "r_x2": 182.33333333333334,
- "r_y2": 201.66666666666669,
- "r_x3": 182.33333333333334,
- "r_y3": 230.66666666666666,
+ "r_x0": 126.33333333333334,
+ "r_y0": 559.6666666666667,
+ "r_x1": 126.33333333333334,
+ "r_y1": 428.0,
+ "r_x2": 105.66666666666666,
+ "r_y2": 428.0,
+ "r_x3": 105.66666666666666,
+ "r_y3": 559.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 0.9617948900000001,
+ "confidence": 91.0,
"from_ocr": true
},
{
@@ -194,20 +194,20 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 197.66666666666669,
- "r_x1": 191.0,
- "r_y1": 172.0,
- "r_x2": 182.33333333333334,
- "r_y2": 172.0,
- "r_x3": 182.33333333333334,
- "r_y3": 197.66666666666669,
+ "r_x0": 153.0,
+ "r_y0": 526.6666666666667,
+ "r_x1": 153.0,
+ "r_y1": 456.0,
+ "r_x2": 137.0,
+ "r_y2": 456.0,
+ "r_x3": 137.0,
+ "r_y3": 526.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.96105423,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -219,20 +219,20 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 168.66666666666669,
- "r_x1": 191.0,
- "r_y1": 133.0,
- "r_x2": 182.33333333333334,
- "r_y2": 133.0,
- "r_x3": 182.33333333333334,
- "r_y3": 168.66666666666669,
+ "r_x0": 204.33333333333334,
+ "r_y0": 545.0,
+ "r_x1": 204.33333333333334,
+ "r_y1": 442.3333333333333,
+ "r_x2": 188.33333333333331,
+ "r_y2": 442.3333333333333,
+ "r_x3": 188.33333333333331,
+ "r_y3": 545.0,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.95868614,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -244,20 +244,20 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 437.3333333333333,
- "r_x1": 237.33333333333331,
- "r_y1": 408.3333333333333,
- "r_x2": 228.66666666666669,
- "r_y2": 408.3333333333333,
- "r_x3": 228.66666666666669,
- "r_y3": 437.3333333333333,
+ "r_x0": 236.0,
+ "r_y0": 515.0,
+ "r_x1": 236.0,
+ "r_y1": 468.0,
+ "r_x2": 220.0,
+ "r_y2": 468.0,
+ "r_x3": 220.0,
+ "r_y3": 515.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9579908,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -269,20 +269,20 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 404.0,
- "r_x1": 237.33333333333331,
- "r_y1": 386.3333333333333,
- "r_x2": 231.0,
- "r_y2": 386.3333333333333,
- "r_x3": 231.0,
- "r_y3": 404.0,
+ "r_x0": 284.0,
+ "r_y0": 545.0,
+ "r_x1": 284.0,
+ "r_y1": 442.3333333333333,
+ "r_x2": 268.0,
+ "r_y2": 442.3333333333333,
+ "r_x3": 268.0,
+ "r_y3": 545.0,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.96640068,
+ "confidence": 93.0,
"from_ocr": true
},
{
@@ -294,20 +294,20 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 326.33333333333337,
- "r_x1": 237.33333333333331,
- "r_y1": 299.0,
- "r_x2": 231.0,
- "r_y2": 299.0,
- "r_x3": 231.0,
- "r_y3": 326.33333333333337,
+ "r_x0": 315.33333333333337,
+ "r_y0": 515.0,
+ "r_x1": 315.33333333333337,
+ "r_y1": 468.0,
+ "r_x2": 299.66666666666663,
+ "r_y2": 468.0,
+ "r_x3": 299.66666666666663,
+ "r_y3": 515.0,
"coord_origin": "TOPLEFT"
},
- "text": "some",
- "orig": "some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96376541,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -319,20 +319,20 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 295.33333333333337,
- "r_x1": 237.33333333333331,
- "r_y1": 279.0,
- "r_x2": 228.66666666666669,
- "r_y2": 279.0,
- "r_x3": 228.66666666666669,
- "r_y3": 295.33333333333337,
+ "r_x0": 121.66666666666666,
+ "r_y0": 385.6666666666667,
+ "r_x1": 121.66666666666666,
+ "r_y1": 274.0,
+ "r_x2": 105.66666666666666,
+ "r_y2": 274.0,
+ "r_x3": 105.66666666666666,
+ "r_y3": 385.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "cell",
- "orig": "cell",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.95824509,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -344,20 +344,20 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 213.66666666666666,
- "r_x1": 237.33333333333331,
- "r_y1": 190.0,
- "r_x2": 228.66666666666669,
- "r_y2": 190.0,
- "r_x3": 228.66666666666669,
- "r_y3": 213.66666666666666,
+ "r_x0": 153.0,
+ "r_y0": 363.0,
+ "r_x1": 153.0,
+ "r_y1": 292.66666666666663,
+ "r_x2": 137.0,
+ "r_y2": 292.66666666666663,
+ "r_x3": 137.0,
+ "r_y3": 363.0,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9643471499999999,
+ "confidence": 94.0,
"from_ocr": true
},
{
@@ -369,20 +369,20 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 186.0,
- "r_x1": 237.33333333333331,
- "r_y1": 149.0,
- "r_x2": 229.0,
- "r_y2": 149.0,
- "r_x3": 229.0,
- "r_y3": 186.0,
+ "r_x0": 204.33333333333334,
+ "r_y0": 384.0,
+ "r_x1": 204.33333333333334,
+ "r_y1": 278.0,
+ "r_x2": 188.33333333333331,
+ "r_y2": 278.0,
+ "r_x3": 188.33333333333331,
+ "r_y3": 384.0,
"coord_origin": "TOPLEFT"
},
- "text": "content",
- "orig": "content",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.96289528,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -394,20 +394,20 @@
"a": 255
},
"rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 451.6666666666667,
- "r_x1": 283.66666666666663,
- "r_y1": 422.6666666666667,
- "r_x2": 275.0,
- "r_y2": 422.6666666666667,
- "r_x3": 275.0,
- "r_y3": 451.6666666666667,
+ "r_x0": 236.0,
+ "r_y0": 351.33333333333337,
+ "r_x1": 236.0,
+ "r_y1": 304.33333333333337,
+ "r_x2": 220.0,
+ "r_y2": 304.33333333333337,
+ "r_x3": 220.0,
+ "r_y3": 351.33333333333337,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9611363199999999,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -419,20 +419,20 @@
"a": 255
},
"rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 419.0,
- "r_x1": 283.66666666666663,
- "r_y1": 393.0,
- "r_x2": 275.0,
- "r_y2": 393.0,
- "r_x3": 275.0,
- "r_y3": 419.0,
+ "r_x0": 284.0,
+ "r_y0": 383.6666666666667,
+ "r_x1": 284.0,
+ "r_y1": 278.0,
+ "r_x2": 268.0,
+ "r_y2": 278.0,
+ "r_x3": 268.0,
+ "r_y3": 383.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.9588653600000001,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -444,70 +444,20 @@
"a": 255
},
"rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 389.3333333333333,
- "r_x1": 283.66666666666663,
- "r_y1": 371.6666666666667,
- "r_x2": 277.33333333333337,
- "r_y2": 371.6666666666667,
- "r_x3": 277.33333333333337,
- "r_y3": 389.3333333333333,
+ "r_x0": 315.33333333333337,
+ "r_y0": 351.33333333333337,
+ "r_x1": 315.33333333333337,
+ "r_y1": 304.33333333333337,
+ "r_x2": 299.66666666666663,
+ "r_y2": 304.33333333333337,
+ "r_x3": 299.66666666666663,
+ "r_y3": 351.33333333333337,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.95681549,
- "from_ocr": true
- },
- {
- "index": 16,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 329.0,
- "r_x1": 283.66666666666663,
- "r_y1": 303.0,
- "r_x2": 275.0,
- "r_y2": 303.0,
- "r_x3": 275.0,
- "r_y3": 329.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.9589106,
- "from_ocr": true
- },
- {
- "index": 17,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 299.66666666666663,
- "r_x1": 283.66666666666663,
- "r_y1": 275.66666666666663,
- "r_x2": 275.0,
- "r_y2": 275.66666666666663,
- "r_x3": 275.0,
- "r_y3": 299.66666666666663,
- "coord_origin": "TOPLEFT"
- },
- "text": "don't",
- "orig": "don't",
- "text_direction": "left_to_right",
- "confidence": 0.96121948,
+ "confidence": 95.0,
"from_ocr": true
}
],
@@ -521,16 +471,16 @@
"layout": {
"clusters": [
{
- "id": 9,
- "label": "section_header",
+ "id": 0,
+ "label": "table",
"bbox": {
- "l": 72.850723,
- "t": 194.03978999999998,
- "r": 101.89737999999998,
- "b": 410.7366,
+ "l": 87.64582824707031,
+ "t": 240.90216064453125,
+ "r": 334.5821228027344,
+ "b": 722.9614028930664,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.6652874946594238,
+ "confidence": 0.9790208339691162,
"cells": [
{
"index": 0,
@@ -541,37 +491,22 @@
"a": 255
},
"rect": {
- "r_x0": 72.850723,
- "r_y0": 410.7366,
- "r_x1": 101.89737999999998,
- "r_y1": 410.7366,
- "r_x2": 101.89737999999998,
- "r_y2": 194.03978999999998,
- "r_x3": 72.850723,
- "r_y3": 194.03978999999998,
+ "r_x0": 126.33333333333334,
+ "r_y0": 694.6666666666666,
+ "r_x1": 126.33333333333334,
+ "r_y1": 602.0,
+ "r_x2": 105.66666666666666,
+ "r_y2": 602.0,
+ "r_x3": 105.66666666666666,
+ "r_y3": 694.6666666666666,
"coord_origin": "TOPLEFT"
},
- "text": "This is a table test ",
- "orig": "This is a table test ",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- }
- ],
- "children": []
- },
- {
- "id": 7,
- "label": "text",
- "bbox": {
- "l": 124.28839,
- "t": 235.72681,
- "r": 136.57715,
- "b": 540.000015,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.8457421064376831,
- "cells": [
+ "confidence": 90.0,
+ "from_ocr": true
+ },
{
"index": 1,
"rgba": {
@@ -581,37 +516,22 @@
"a": 255
},
"rect": {
- "r_x0": 124.28839,
- "r_y0": 540.000015,
- "r_x1": 136.57715,
- "r_y1": 540.000015,
- "r_x2": 136.57715,
- "r_y2": 235.72681,
- "r_x3": 124.28839,
- "r_y3": 235.72681,
+ "r_x0": 157.66666666666669,
+ "r_y0": 680.3333333333334,
+ "r_x1": 157.66666666666669,
+ "r_y1": 610.0,
+ "r_x2": 137.0,
+ "r_y2": 610.0,
+ "r_x3": 137.0,
+ "r_y3": 680.3333333333334,
"coord_origin": "TOPLEFT"
},
- "text": "Theteststartswithsomerandomtextandthenatableimage: ",
- "orig": "Theteststartswithsomerandomtextandthenatableimage: ",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- }
- ],
- "children": []
- },
- {
- "id": 8,
- "label": "form",
- "bbox": {
- "l": 182.33333333333334,
- "t": 133.0,
- "r": 283.66666666666663,
- "b": 451.6666666666667,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.7344542741775513,
- "cells": [
+ "confidence": 92.0,
+ "from_ocr": true
+ },
{
"index": 2,
"rgba": {
@@ -621,20 +541,20 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 337.0,
- "r_x1": 191.0,
- "r_y1": 308.0,
- "r_x2": 182.33333333333334,
- "r_y2": 308.0,
- "r_x3": 182.33333333333334,
- "r_y3": 337.0,
+ "r_x0": 220.0,
+ "r_y0": 670.3333333333334,
+ "r_x1": 220.0,
+ "r_y1": 623.3333333333334,
+ "r_x2": 204.0,
+ "r_y2": 623.3333333333334,
+ "r_x3": 204.0,
+ "r_y3": 670.3333333333334,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9576889799999999,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -646,20 +566,20 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 304.0,
- "r_x1": 191.0,
- "r_y1": 268.33333333333337,
- "r_x2": 182.33333333333334,
- "r_y2": 268.33333333333337,
- "r_x3": 182.33333333333334,
- "r_y3": 304.0,
+ "r_x0": 300.0,
+ "r_y0": 670.3333333333334,
+ "r_x1": 300.0,
+ "r_y1": 623.3333333333334,
+ "r_x2": 284.0,
+ "r_y2": 623.3333333333334,
+ "r_x3": 284.0,
+ "r_y3": 670.3333333333334,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9576889799999999,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -671,20 +591,20 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 230.66666666666666,
- "r_x1": 191.0,
- "r_y1": 201.66666666666669,
- "r_x2": 182.33333333333334,
- "r_y2": 201.66666666666669,
- "r_x3": 182.33333333333334,
- "r_y3": 230.66666666666666,
+ "r_x0": 126.33333333333334,
+ "r_y0": 559.6666666666667,
+ "r_x1": 126.33333333333334,
+ "r_y1": 428.0,
+ "r_x2": 105.66666666666666,
+ "r_y2": 428.0,
+ "r_x3": 105.66666666666666,
+ "r_y3": 559.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 0.9617948900000001,
+ "confidence": 91.0,
"from_ocr": true
},
{
@@ -696,20 +616,20 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 197.66666666666669,
- "r_x1": 191.0,
- "r_y1": 172.0,
- "r_x2": 182.33333333333334,
- "r_y2": 172.0,
- "r_x3": 182.33333333333334,
- "r_y3": 197.66666666666669,
+ "r_x0": 153.0,
+ "r_y0": 526.6666666666667,
+ "r_x1": 153.0,
+ "r_y1": 456.0,
+ "r_x2": 137.0,
+ "r_y2": 456.0,
+ "r_x3": 137.0,
+ "r_y3": 526.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.96105423,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -721,20 +641,20 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 168.66666666666669,
- "r_x1": 191.0,
- "r_y1": 133.0,
- "r_x2": 182.33333333333334,
- "r_y2": 133.0,
- "r_x3": 182.33333333333334,
- "r_y3": 168.66666666666669,
+ "r_x0": 204.33333333333334,
+ "r_y0": 545.0,
+ "r_x1": 204.33333333333334,
+ "r_y1": 442.3333333333333,
+ "r_x2": 188.33333333333331,
+ "r_y2": 442.3333333333333,
+ "r_x3": 188.33333333333331,
+ "r_y3": 545.0,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.95868614,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -746,20 +666,20 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 437.3333333333333,
- "r_x1": 237.33333333333331,
- "r_y1": 408.3333333333333,
- "r_x2": 228.66666666666669,
- "r_y2": 408.3333333333333,
- "r_x3": 228.66666666666669,
- "r_y3": 437.3333333333333,
+ "r_x0": 236.0,
+ "r_y0": 515.0,
+ "r_x1": 236.0,
+ "r_y1": 468.0,
+ "r_x2": 220.0,
+ "r_y2": 468.0,
+ "r_x3": 220.0,
+ "r_y3": 515.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9579908,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -771,20 +691,20 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 404.0,
- "r_x1": 237.33333333333331,
- "r_y1": 386.3333333333333,
- "r_x2": 231.0,
- "r_y2": 386.3333333333333,
- "r_x3": 231.0,
- "r_y3": 404.0,
+ "r_x0": 284.0,
+ "r_y0": 545.0,
+ "r_x1": 284.0,
+ "r_y1": 442.3333333333333,
+ "r_x2": 268.0,
+ "r_y2": 442.3333333333333,
+ "r_x3": 268.0,
+ "r_y3": 545.0,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.96640068,
+ "confidence": 93.0,
"from_ocr": true
},
{
@@ -796,20 +716,20 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 326.33333333333337,
- "r_x1": 237.33333333333331,
- "r_y1": 299.0,
- "r_x2": 231.0,
- "r_y2": 299.0,
- "r_x3": 231.0,
- "r_y3": 326.33333333333337,
+ "r_x0": 315.33333333333337,
+ "r_y0": 515.0,
+ "r_x1": 315.33333333333337,
+ "r_y1": 468.0,
+ "r_x2": 299.66666666666663,
+ "r_y2": 468.0,
+ "r_x3": 299.66666666666663,
+ "r_y3": 515.0,
"coord_origin": "TOPLEFT"
},
- "text": "some",
- "orig": "some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96376541,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -821,20 +741,20 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 295.33333333333337,
- "r_x1": 237.33333333333331,
- "r_y1": 279.0,
- "r_x2": 228.66666666666669,
- "r_y2": 279.0,
- "r_x3": 228.66666666666669,
- "r_y3": 295.33333333333337,
+ "r_x0": 121.66666666666666,
+ "r_y0": 385.6666666666667,
+ "r_x1": 121.66666666666666,
+ "r_y1": 274.0,
+ "r_x2": 105.66666666666666,
+ "r_y2": 274.0,
+ "r_x3": 105.66666666666666,
+ "r_y3": 385.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "cell",
- "orig": "cell",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.95824509,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -846,20 +766,20 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 213.66666666666666,
- "r_x1": 237.33333333333331,
- "r_y1": 190.0,
- "r_x2": 228.66666666666669,
- "r_y2": 190.0,
- "r_x3": 228.66666666666669,
- "r_y3": 213.66666666666666,
+ "r_x0": 153.0,
+ "r_y0": 363.0,
+ "r_x1": 153.0,
+ "r_y1": 292.66666666666663,
+ "r_x2": 137.0,
+ "r_y2": 292.66666666666663,
+ "r_x3": 137.0,
+ "r_y3": 363.0,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9643471499999999,
+ "confidence": 94.0,
"from_ocr": true
},
{
@@ -871,20 +791,20 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 186.0,
- "r_x1": 237.33333333333331,
- "r_y1": 149.0,
- "r_x2": 229.0,
- "r_y2": 149.0,
- "r_x3": 229.0,
- "r_y3": 186.0,
+ "r_x0": 204.33333333333334,
+ "r_y0": 384.0,
+ "r_x1": 204.33333333333334,
+ "r_y1": 278.0,
+ "r_x2": 188.33333333333331,
+ "r_y2": 278.0,
+ "r_x3": 188.33333333333331,
+ "r_y3": 384.0,
"coord_origin": "TOPLEFT"
},
- "text": "content",
- "orig": "content",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.96289528,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -896,20 +816,20 @@
"a": 255
},
"rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 451.6666666666667,
- "r_x1": 283.66666666666663,
- "r_y1": 422.6666666666667,
- "r_x2": 275.0,
- "r_y2": 422.6666666666667,
- "r_x3": 275.0,
- "r_y3": 451.6666666666667,
+ "r_x0": 236.0,
+ "r_y0": 351.33333333333337,
+ "r_x1": 236.0,
+ "r_y1": 304.33333333333337,
+ "r_x2": 220.0,
+ "r_y2": 304.33333333333337,
+ "r_x3": 220.0,
+ "r_y3": 351.33333333333337,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9611363199999999,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -921,20 +841,20 @@
"a": 255
},
"rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 419.0,
- "r_x1": 283.66666666666663,
- "r_y1": 393.0,
- "r_x2": 275.0,
- "r_y2": 393.0,
- "r_x3": 275.0,
- "r_y3": 419.0,
+ "r_x0": 284.0,
+ "r_y0": 383.6666666666667,
+ "r_x1": 284.0,
+ "r_y1": 278.0,
+ "r_x2": 268.0,
+ "r_y2": 278.0,
+ "r_x3": 268.0,
+ "r_y3": 383.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.9588653600000001,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -946,85 +866,115 @@
"a": 255
},
"rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 389.3333333333333,
- "r_x1": 283.66666666666663,
- "r_y1": 371.6666666666667,
- "r_x2": 277.33333333333337,
- "r_y2": 371.6666666666667,
- "r_x3": 277.33333333333337,
- "r_y3": 389.3333333333333,
+ "r_x0": 315.33333333333337,
+ "r_y0": 351.33333333333337,
+ "r_x1": 315.33333333333337,
+ "r_y1": 304.33333333333337,
+ "r_x2": 299.66666666666663,
+ "r_y2": 304.33333333333337,
+ "r_x3": 299.66666666666663,
+ "r_y3": 351.33333333333337,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.95681549,
- "from_ocr": true
- },
- {
- "index": 16,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 329.0,
- "r_x1": 283.66666666666663,
- "r_y1": 303.0,
- "r_x2": 275.0,
- "r_y2": 303.0,
- "r_x3": 275.0,
- "r_y3": 329.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.9589106,
- "from_ocr": true
- },
- {
- "index": 17,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 299.66666666666663,
- "r_x1": 283.66666666666663,
- "r_y1": 275.66666666666663,
- "r_x2": 275.0,
- "r_y2": 275.66666666666663,
- "r_x3": 275.0,
- "r_y3": 299.66666666666663,
- "coord_origin": "TOPLEFT"
- },
- "text": "don't",
- "orig": "don't",
- "text_direction": "left_to_right",
- "confidence": 0.96121948,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": [
{
- "id": 4,
+ "id": 1,
"label": "text",
"bbox": {
- "l": 182.33333333333334,
- "t": 268.33333333333337,
- "r": 191.0,
- "b": 337.0,
+ "l": 105.66666666666666,
+ "t": 602.0,
+ "r": 126.33333333333334,
+ "b": 694.6666666666666,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9089116454124451,
+ "confidence": 90.0,
+ "cells": [
+ {
+ "index": 0,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 126.33333333333334,
+ "r_y0": 694.6666666666666,
+ "r_x1": 126.33333333333334,
+ "r_y1": 602.0,
+ "r_x2": 105.66666666666666,
+ "r_y2": 602.0,
+ "r_x3": 105.66666666666666,
+ "r_y3": 694.6666666666666,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Vertically",
+ "orig": "Vertically",
+ "text_direction": "left_to_right",
+ "confidence": 90.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 2,
+ "label": "text",
+ "bbox": {
+ "l": 137.0,
+ "t": 610.0,
+ "r": 157.66666666666669,
+ "b": 680.3333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 92.0,
+ "cells": [
+ {
+ "index": 1,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 157.66666666666669,
+ "r_y0": 680.3333333333334,
+ "r_x1": 157.66666666666669,
+ "r_y1": 610.0,
+ "r_x2": 137.0,
+ "r_y2": 610.0,
+ "r_x3": 137.0,
+ "r_y3": 680.3333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "merged",
+ "orig": "merged",
+ "text_direction": "left_to_right",
+ "confidence": 92.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 3,
+ "label": "text",
+ "bbox": {
+ "l": 204.0,
+ "t": 623.3333333333334,
+ "r": 220.0,
+ "b": 670.3333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
"cells": [
{
"index": 2,
@@ -1035,22 +985,37 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 337.0,
- "r_x1": 191.0,
- "r_y1": 308.0,
- "r_x2": 182.33333333333334,
- "r_y2": 308.0,
- "r_x3": 182.33333333333334,
- "r_y3": 337.0,
+ "r_x0": 220.0,
+ "r_y0": 670.3333333333334,
+ "r_x1": 220.0,
+ "r_y1": 623.3333333333334,
+ "r_x2": 204.0,
+ "r_y2": 623.3333333333334,
+ "r_x3": 204.0,
+ "r_y3": 670.3333333333334,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9576889799999999,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 4,
+ "label": "text",
+ "bbox": {
+ "l": 284.0,
+ "t": 623.3333333333334,
+ "r": 300.0,
+ "b": 670.3333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
{
"index": 3,
"rgba": {
@@ -1060,20 +1025,20 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 304.0,
- "r_x1": 191.0,
- "r_y1": 268.33333333333337,
- "r_x2": 182.33333333333334,
- "r_y2": 268.33333333333337,
- "r_x3": 182.33333333333334,
- "r_y3": 304.0,
+ "r_x0": 300.0,
+ "r_y0": 670.3333333333334,
+ "r_x1": 300.0,
+ "r_y1": 623.3333333333334,
+ "r_x2": 284.0,
+ "r_y2": 623.3333333333334,
+ "r_x3": 284.0,
+ "r_y3": 670.3333333333334,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9576889799999999,
+ "confidence": 96.0,
"from_ocr": true
}
],
@@ -1083,13 +1048,13 @@
"id": 5,
"label": "text",
"bbox": {
- "l": 182.33333333333334,
- "t": 133.0,
- "r": 191.0,
- "b": 230.66666666666666,
+ "l": 105.66666666666666,
+ "t": 428.0,
+ "r": 126.33333333333334,
+ "b": 559.6666666666667,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9040389060974121,
+ "confidence": 91.0,
"cells": [
{
"index": 4,
@@ -1100,22 +1065,37 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 230.66666666666666,
- "r_x1": 191.0,
- "r_y1": 201.66666666666669,
- "r_x2": 182.33333333333334,
- "r_y2": 201.66666666666669,
- "r_x3": 182.33333333333334,
- "r_y3": 230.66666666666666,
+ "r_x0": 126.33333333333334,
+ "r_y0": 559.6666666666667,
+ "r_x1": 126.33333333333334,
+ "r_y1": 428.0,
+ "r_x2": 105.66666666666666,
+ "r_y2": 428.0,
+ "r_x3": 105.66666666666666,
+ "r_y3": 559.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 0.9617948900000001,
+ "confidence": 91.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 6,
+ "label": "text",
+ "bbox": {
+ "l": 137.0,
+ "t": 456.0,
+ "r": 153.0,
+ "b": 526.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 5,
"rgba": {
@@ -1125,22 +1105,37 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 197.66666666666669,
- "r_x1": 191.0,
- "r_y1": 172.0,
- "r_x2": 182.33333333333334,
- "r_y2": 172.0,
- "r_x3": 182.33333333333334,
- "r_y3": 197.66666666666669,
+ "r_x0": 153.0,
+ "r_y0": 526.6666666666667,
+ "r_x1": 153.0,
+ "r_y1": 456.0,
+ "r_x2": 137.0,
+ "r_y2": 456.0,
+ "r_x3": 137.0,
+ "r_y3": 526.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.96105423,
+ "confidence": 95.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 7,
+ "label": "text",
+ "bbox": {
+ "l": 188.33333333333331,
+ "t": 442.3333333333333,
+ "r": 204.33333333333334,
+ "b": 545.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 6,
"rgba": {
@@ -1150,36 +1145,36 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 168.66666666666669,
- "r_x1": 191.0,
- "r_y1": 133.0,
- "r_x2": 182.33333333333334,
- "r_y2": 133.0,
- "r_x3": 182.33333333333334,
- "r_y3": 168.66666666666669,
+ "r_x0": 204.33333333333334,
+ "r_y0": 545.0,
+ "r_x1": 204.33333333333334,
+ "r_y1": 442.3333333333333,
+ "r_x2": 188.33333333333331,
+ "r_y2": 442.3333333333333,
+ "r_x3": 188.33333333333331,
+ "r_y3": 545.0,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.95868614,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 0,
+ "id": 8,
"label": "text",
"bbox": {
- "l": 228.66666666666669,
- "t": 386.3333333333333,
- "r": 237.33333333333331,
- "b": 437.3333333333333,
+ "l": 220.0,
+ "t": 468.0,
+ "r": 236.0,
+ "b": 515.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9155756235122681,
+ "confidence": 96.0,
"cells": [
{
"index": 7,
@@ -1190,22 +1185,37 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 437.3333333333333,
- "r_x1": 237.33333333333331,
- "r_y1": 408.3333333333333,
- "r_x2": 228.66666666666669,
- "r_y2": 408.3333333333333,
- "r_x3": 228.66666666666669,
- "r_y3": 437.3333333333333,
+ "r_x0": 236.0,
+ "r_y0": 515.0,
+ "r_x1": 236.0,
+ "r_y1": 468.0,
+ "r_x2": 220.0,
+ "r_y2": 468.0,
+ "r_x3": 220.0,
+ "r_y3": 515.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9579908,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 9,
+ "label": "text",
+ "bbox": {
+ "l": 268.0,
+ "t": 442.3333333333333,
+ "r": 284.0,
+ "b": 545.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 93.0,
+ "cells": [
{
"index": 8,
"rgba": {
@@ -1215,36 +1225,36 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 404.0,
- "r_x1": 237.33333333333331,
- "r_y1": 386.3333333333333,
- "r_x2": 231.0,
- "r_y2": 386.3333333333333,
- "r_x3": 231.0,
- "r_y3": 404.0,
+ "r_x0": 284.0,
+ "r_y0": 545.0,
+ "r_x1": 284.0,
+ "r_y1": 442.3333333333333,
+ "r_x2": 268.0,
+ "r_y2": 442.3333333333333,
+ "r_x3": 268.0,
+ "r_y3": 545.0,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.96640068,
+ "confidence": 93.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 2,
+ "id": 10,
"label": "text",
"bbox": {
- "l": 228.66666666666669,
- "t": 279.0,
- "r": 237.33333333333331,
- "b": 326.33333333333337,
+ "l": 299.66666666666663,
+ "t": 468.0,
+ "r": 315.33333333333337,
+ "b": 515.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9143174290657043,
+ "confidence": 96.0,
"cells": [
{
"index": 9,
@@ -1255,22 +1265,37 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 326.33333333333337,
- "r_x1": 237.33333333333331,
- "r_y1": 299.0,
- "r_x2": 231.0,
- "r_y2": 299.0,
- "r_x3": 231.0,
- "r_y3": 326.33333333333337,
+ "r_x0": 315.33333333333337,
+ "r_y0": 515.0,
+ "r_x1": 315.33333333333337,
+ "r_y1": 468.0,
+ "r_x2": 299.66666666666663,
+ "r_y2": 468.0,
+ "r_x3": 299.66666666666663,
+ "r_y3": 515.0,
"coord_origin": "TOPLEFT"
},
- "text": "some",
- "orig": "some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96376541,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 11,
+ "label": "text",
+ "bbox": {
+ "l": 105.66666666666666,
+ "t": 274.0,
+ "r": 121.66666666666666,
+ "b": 385.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 10,
"rgba": {
@@ -1280,36 +1305,36 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 295.33333333333337,
- "r_x1": 237.33333333333331,
- "r_y1": 279.0,
- "r_x2": 228.66666666666669,
- "r_y2": 279.0,
- "r_x3": 228.66666666666669,
- "r_y3": 295.33333333333337,
+ "r_x0": 121.66666666666666,
+ "r_y0": 385.6666666666667,
+ "r_x1": 121.66666666666666,
+ "r_y1": 274.0,
+ "r_x2": 105.66666666666666,
+ "r_y2": 274.0,
+ "r_x3": 105.66666666666666,
+ "r_y3": 385.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "cell",
- "orig": "cell",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.95824509,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 6,
+ "id": 12,
"label": "text",
"bbox": {
- "l": 228.66666666666669,
- "t": 149.0,
- "r": 237.33333333333331,
- "b": 213.66666666666666,
+ "l": 137.0,
+ "t": 292.66666666666663,
+ "r": 153.0,
+ "b": 363.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9003775715827942,
+ "confidence": 94.0,
"cells": [
{
"index": 11,
@@ -1320,22 +1345,37 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 213.66666666666666,
- "r_x1": 237.33333333333331,
- "r_y1": 190.0,
- "r_x2": 228.66666666666669,
- "r_y2": 190.0,
- "r_x3": 228.66666666666669,
- "r_y3": 213.66666666666666,
+ "r_x0": 153.0,
+ "r_y0": 363.0,
+ "r_x1": 153.0,
+ "r_y1": 292.66666666666663,
+ "r_x2": 137.0,
+ "r_y2": 292.66666666666663,
+ "r_x3": 137.0,
+ "r_y3": 363.0,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9643471499999999,
+ "confidence": 94.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 13,
+ "label": "text",
+ "bbox": {
+ "l": 188.33333333333331,
+ "t": 278.0,
+ "r": 204.33333333333334,
+ "b": 384.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 12,
"rgba": {
@@ -1345,36 +1385,36 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 186.0,
- "r_x1": 237.33333333333331,
- "r_y1": 149.0,
- "r_x2": 229.0,
- "r_y2": 149.0,
- "r_x3": 229.0,
- "r_y3": 186.0,
+ "r_x0": 204.33333333333334,
+ "r_y0": 384.0,
+ "r_x1": 204.33333333333334,
+ "r_y1": 278.0,
+ "r_x2": 188.33333333333331,
+ "r_y2": 278.0,
+ "r_x3": 188.33333333333331,
+ "r_y3": 384.0,
"coord_origin": "TOPLEFT"
},
- "text": "content",
- "orig": "content",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.96289528,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 1,
+ "id": 14,
"label": "text",
"bbox": {
- "l": 275.0,
- "t": 371.6666666666667,
- "r": 283.66666666666663,
- "b": 451.6666666666667,
+ "l": 220.0,
+ "t": 304.33333333333337,
+ "r": 236.0,
+ "b": 351.33333333333337,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9147250652313232,
+ "confidence": 95.0,
"cells": [
{
"index": 13,
@@ -1385,22 +1425,37 @@
"a": 255
},
"rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 451.6666666666667,
- "r_x1": 283.66666666666663,
- "r_y1": 422.6666666666667,
- "r_x2": 275.0,
- "r_y2": 422.6666666666667,
- "r_x3": 275.0,
- "r_y3": 451.6666666666667,
+ "r_x0": 236.0,
+ "r_y0": 351.33333333333337,
+ "r_x1": 236.0,
+ "r_y1": 304.33333333333337,
+ "r_x2": 220.0,
+ "r_y2": 304.33333333333337,
+ "r_x3": 220.0,
+ "r_y3": 351.33333333333337,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9611363199999999,
+ "confidence": 95.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 15,
+ "label": "text",
+ "bbox": {
+ "l": 268.0,
+ "t": 278.0,
+ "r": 284.0,
+ "b": 383.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 14,
"rgba": {
@@ -1410,22 +1465,37 @@
"a": 255
},
"rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 419.0,
- "r_x1": 283.66666666666663,
- "r_y1": 393.0,
- "r_x2": 275.0,
- "r_y2": 393.0,
- "r_x3": 275.0,
- "r_y3": 419.0,
+ "r_x0": 284.0,
+ "r_y0": 383.6666666666667,
+ "r_x1": 284.0,
+ "r_y1": 278.0,
+ "r_x2": 268.0,
+ "r_y2": 278.0,
+ "r_x3": 268.0,
+ "r_y3": 383.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.9588653600000001,
+ "confidence": 95.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 16,
+ "label": "text",
+ "bbox": {
+ "l": 299.66666666666663,
+ "t": 304.33333333333337,
+ "r": 315.33333333333337,
+ "b": 351.33333333333337,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 15,
"rgba": {
@@ -1435,85 +1505,20 @@
"a": 255
},
"rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 389.3333333333333,
- "r_x1": 283.66666666666663,
- "r_y1": 371.6666666666667,
- "r_x2": 277.33333333333337,
- "r_y2": 371.6666666666667,
- "r_x3": 277.33333333333337,
- "r_y3": 389.3333333333333,
+ "r_x0": 315.33333333333337,
+ "r_y0": 351.33333333333337,
+ "r_x1": 315.33333333333337,
+ "r_y1": 304.33333333333337,
+ "r_x2": 299.66666666666663,
+ "r_y2": 304.33333333333337,
+ "r_x3": 299.66666666666663,
+ "r_y3": 351.33333333333337,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.95681549,
- "from_ocr": true
- }
- ],
- "children": []
- },
- {
- "id": 3,
- "label": "text",
- "bbox": {
- "l": 275.0,
- "t": 275.66666666666663,
- "r": 283.66666666666663,
- "b": 329.0,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.9124712347984314,
- "cells": [
- {
- "index": 16,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 329.0,
- "r_x1": 283.66666666666663,
- "r_y1": 303.0,
- "r_x2": 275.0,
- "r_y2": 303.0,
- "r_x3": 275.0,
- "r_y3": 329.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.9589106,
- "from_ocr": true
- },
- {
- "index": 17,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 299.66666666666663,
- "r_x1": 283.66666666666663,
- "r_y1": 275.66666666666663,
- "r_x2": 275.0,
- "r_y2": 275.66666666666663,
- "r_x3": 275.0,
- "r_y3": 299.66666666666663,
- "coord_origin": "TOPLEFT"
- },
- "text": "don't",
- "orig": "don't",
- "text_direction": "left_to_right",
- "confidence": 0.96121948,
+ "confidence": 95.0,
"from_ocr": true
}
],
@@ -1524,7 +1529,1087 @@
]
},
"tablestructure": {
- "table_map": {}
+ "table_map": {
+ "0": {
+ "label": "table",
+ "id": 0,
+ "page_no": 0,
+ "cluster": {
+ "id": 0,
+ "label": "table",
+ "bbox": {
+ "l": 87.64582824707031,
+ "t": 240.90216064453125,
+ "r": 334.5821228027344,
+ "b": 722.9614028930664,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 0.9790208339691162,
+ "cells": [
+ {
+ "index": 0,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 126.33333333333334,
+ "r_y0": 694.6666666666666,
+ "r_x1": 126.33333333333334,
+ "r_y1": 602.0,
+ "r_x2": 105.66666666666666,
+ "r_y2": 602.0,
+ "r_x3": 105.66666666666666,
+ "r_y3": 694.6666666666666,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Vertically",
+ "orig": "Vertically",
+ "text_direction": "left_to_right",
+ "confidence": 90.0,
+ "from_ocr": true
+ },
+ {
+ "index": 1,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 157.66666666666669,
+ "r_y0": 680.3333333333334,
+ "r_x1": 157.66666666666669,
+ "r_y1": 610.0,
+ "r_x2": 137.0,
+ "r_y2": 610.0,
+ "r_x3": 137.0,
+ "r_y3": 680.3333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "merged",
+ "orig": "merged",
+ "text_direction": "left_to_right",
+ "confidence": 92.0,
+ "from_ocr": true
+ },
+ {
+ "index": 2,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 220.0,
+ "r_y0": 670.3333333333334,
+ "r_x1": 220.0,
+ "r_y1": 623.3333333333334,
+ "r_x2": 204.0,
+ "r_y2": 623.3333333333334,
+ "r_x3": 204.0,
+ "r_y3": 670.3333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ },
+ {
+ "index": 3,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 300.0,
+ "r_y0": 670.3333333333334,
+ "r_x1": 300.0,
+ "r_y1": 623.3333333333334,
+ "r_x2": 284.0,
+ "r_y2": 623.3333333333334,
+ "r_x3": 284.0,
+ "r_y3": 670.3333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ },
+ {
+ "index": 4,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 126.33333333333334,
+ "r_y0": 559.6666666666667,
+ "r_x1": 126.33333333333334,
+ "r_y1": 428.0,
+ "r_x2": 105.66666666666666,
+ "r_y2": 428.0,
+ "r_x3": 105.66666666666666,
+ "r_y3": 559.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Other merged",
+ "orig": "Other merged",
+ "text_direction": "left_to_right",
+ "confidence": 91.0,
+ "from_ocr": true
+ },
+ {
+ "index": 5,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 153.0,
+ "r_y0": 526.6666666666667,
+ "r_x1": 153.0,
+ "r_y1": 456.0,
+ "r_x2": 137.0,
+ "r_y2": 456.0,
+ "r_x3": 137.0,
+ "r_y3": 526.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "column",
+ "orig": "column",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 6,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 204.33333333333334,
+ "r_y0": 545.0,
+ "r_x1": 204.33333333333334,
+ "r_y1": 442.3333333333333,
+ "r_x2": 188.33333333333331,
+ "r_y2": 442.3333333333333,
+ "r_x3": 188.33333333333331,
+ "r_y3": 545.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Some other",
+ "orig": "Some other",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 7,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 236.0,
+ "r_y0": 515.0,
+ "r_x1": 236.0,
+ "r_y1": 468.0,
+ "r_x2": 220.0,
+ "r_y2": 468.0,
+ "r_x3": 220.0,
+ "r_y3": 515.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ },
+ {
+ "index": 8,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 284.0,
+ "r_y0": 545.0,
+ "r_x1": 284.0,
+ "r_y1": 442.3333333333333,
+ "r_x2": 268.0,
+ "r_y2": 442.3333333333333,
+ "r_x3": 268.0,
+ "r_y3": 545.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Some other",
+ "orig": "Some other",
+ "text_direction": "left_to_right",
+ "confidence": 93.0,
+ "from_ocr": true
+ },
+ {
+ "index": 9,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 315.33333333333337,
+ "r_y0": 515.0,
+ "r_x1": 315.33333333333337,
+ "r_y1": 468.0,
+ "r_x2": 299.66666666666663,
+ "r_y2": 468.0,
+ "r_x3": 299.66666666666663,
+ "r_y3": 515.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ },
+ {
+ "index": 10,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 121.66666666666666,
+ "r_y0": 385.6666666666667,
+ "r_x1": 121.66666666666666,
+ "r_y1": 274.0,
+ "r_x2": 105.66666666666666,
+ "r_y2": 274.0,
+ "r_x3": 105.66666666666666,
+ "r_y3": 385.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 11,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 153.0,
+ "r_y0": 363.0,
+ "r_x1": 153.0,
+ "r_y1": 292.66666666666663,
+ "r_x2": 137.0,
+ "r_y2": 292.66666666666663,
+ "r_x3": 137.0,
+ "r_y3": 363.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "column",
+ "orig": "column",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ },
+ {
+ "index": 12,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 204.33333333333334,
+ "r_y0": 384.0,
+ "r_x1": 204.33333333333334,
+ "r_y1": 278.0,
+ "r_x2": 188.33333333333331,
+ "r_y2": 278.0,
+ "r_x3": 188.33333333333331,
+ "r_y3": 384.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 236.0,
+ "r_y0": 351.33333333333337,
+ "r_x1": 236.0,
+ "r_y1": 304.33333333333337,
+ "r_x2": 220.0,
+ "r_y2": 304.33333333333337,
+ "r_x3": 220.0,
+ "r_y3": 351.33333333333337,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 284.0,
+ "r_y0": 383.6666666666667,
+ "r_x1": 284.0,
+ "r_y1": 278.0,
+ "r_x2": 268.0,
+ "r_y2": 278.0,
+ "r_x3": 268.0,
+ "r_y3": 383.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 315.33333333333337,
+ "r_y0": 351.33333333333337,
+ "r_x1": 315.33333333333337,
+ "r_y1": 304.33333333333337,
+ "r_x2": 299.66666666666663,
+ "r_y2": 304.33333333333337,
+ "r_x3": 299.66666666666663,
+ "r_y3": 351.33333333333337,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": [
+ {
+ "id": 1,
+ "label": "text",
+ "bbox": {
+ "l": 105.66666666666666,
+ "t": 602.0,
+ "r": 126.33333333333334,
+ "b": 694.6666666666666,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 90.0,
+ "cells": [
+ {
+ "index": 0,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 126.33333333333334,
+ "r_y0": 694.6666666666666,
+ "r_x1": 126.33333333333334,
+ "r_y1": 602.0,
+ "r_x2": 105.66666666666666,
+ "r_y2": 602.0,
+ "r_x3": 105.66666666666666,
+ "r_y3": 694.6666666666666,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Vertically",
+ "orig": "Vertically",
+ "text_direction": "left_to_right",
+ "confidence": 90.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 2,
+ "label": "text",
+ "bbox": {
+ "l": 137.0,
+ "t": 610.0,
+ "r": 157.66666666666669,
+ "b": 680.3333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 92.0,
+ "cells": [
+ {
+ "index": 1,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 157.66666666666669,
+ "r_y0": 680.3333333333334,
+ "r_x1": 157.66666666666669,
+ "r_y1": 610.0,
+ "r_x2": 137.0,
+ "r_y2": 610.0,
+ "r_x3": 137.0,
+ "r_y3": 680.3333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "merged",
+ "orig": "merged",
+ "text_direction": "left_to_right",
+ "confidence": 92.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 3,
+ "label": "text",
+ "bbox": {
+ "l": 204.0,
+ "t": 623.3333333333334,
+ "r": 220.0,
+ "b": 670.3333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
+ {
+ "index": 2,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 220.0,
+ "r_y0": 670.3333333333334,
+ "r_x1": 220.0,
+ "r_y1": 623.3333333333334,
+ "r_x2": 204.0,
+ "r_y2": 623.3333333333334,
+ "r_x3": 204.0,
+ "r_y3": 670.3333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 4,
+ "label": "text",
+ "bbox": {
+ "l": 284.0,
+ "t": 623.3333333333334,
+ "r": 300.0,
+ "b": 670.3333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
+ {
+ "index": 3,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 300.0,
+ "r_y0": 670.3333333333334,
+ "r_x1": 300.0,
+ "r_y1": 623.3333333333334,
+ "r_x2": 284.0,
+ "r_y2": 623.3333333333334,
+ "r_x3": 284.0,
+ "r_y3": 670.3333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 5,
+ "label": "text",
+ "bbox": {
+ "l": 105.66666666666666,
+ "t": 428.0,
+ "r": 126.33333333333334,
+ "b": 559.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 91.0,
+ "cells": [
+ {
+ "index": 4,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 126.33333333333334,
+ "r_y0": 559.6666666666667,
+ "r_x1": 126.33333333333334,
+ "r_y1": 428.0,
+ "r_x2": 105.66666666666666,
+ "r_y2": 428.0,
+ "r_x3": 105.66666666666666,
+ "r_y3": 559.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Other merged",
+ "orig": "Other merged",
+ "text_direction": "left_to_right",
+ "confidence": 91.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 6,
+ "label": "text",
+ "bbox": {
+ "l": 137.0,
+ "t": 456.0,
+ "r": 153.0,
+ "b": 526.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 5,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 153.0,
+ "r_y0": 526.6666666666667,
+ "r_x1": 153.0,
+ "r_y1": 456.0,
+ "r_x2": 137.0,
+ "r_y2": 456.0,
+ "r_x3": 137.0,
+ "r_y3": 526.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "column",
+ "orig": "column",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 7,
+ "label": "text",
+ "bbox": {
+ "l": 188.33333333333331,
+ "t": 442.3333333333333,
+ "r": 204.33333333333334,
+ "b": 545.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 6,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 204.33333333333334,
+ "r_y0": 545.0,
+ "r_x1": 204.33333333333334,
+ "r_y1": 442.3333333333333,
+ "r_x2": 188.33333333333331,
+ "r_y2": 442.3333333333333,
+ "r_x3": 188.33333333333331,
+ "r_y3": 545.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Some other",
+ "orig": "Some other",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 8,
+ "label": "text",
+ "bbox": {
+ "l": 220.0,
+ "t": 468.0,
+ "r": 236.0,
+ "b": 515.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
+ {
+ "index": 7,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 236.0,
+ "r_y0": 515.0,
+ "r_x1": 236.0,
+ "r_y1": 468.0,
+ "r_x2": 220.0,
+ "r_y2": 468.0,
+ "r_x3": 220.0,
+ "r_y3": 515.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 9,
+ "label": "text",
+ "bbox": {
+ "l": 268.0,
+ "t": 442.3333333333333,
+ "r": 284.0,
+ "b": 545.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 93.0,
+ "cells": [
+ {
+ "index": 8,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 284.0,
+ "r_y0": 545.0,
+ "r_x1": 284.0,
+ "r_y1": 442.3333333333333,
+ "r_x2": 268.0,
+ "r_y2": 442.3333333333333,
+ "r_x3": 268.0,
+ "r_y3": 545.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Some other",
+ "orig": "Some other",
+ "text_direction": "left_to_right",
+ "confidence": 93.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 10,
+ "label": "text",
+ "bbox": {
+ "l": 299.66666666666663,
+ "t": 468.0,
+ "r": 315.33333333333337,
+ "b": 515.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
+ {
+ "index": 9,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 315.33333333333337,
+ "r_y0": 515.0,
+ "r_x1": 315.33333333333337,
+ "r_y1": 468.0,
+ "r_x2": 299.66666666666663,
+ "r_y2": 468.0,
+ "r_x3": 299.66666666666663,
+ "r_y3": 515.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 11,
+ "label": "text",
+ "bbox": {
+ "l": 105.66666666666666,
+ "t": 274.0,
+ "r": 121.66666666666666,
+ "b": 385.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 10,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 121.66666666666666,
+ "r_y0": 385.6666666666667,
+ "r_x1": 121.66666666666666,
+ "r_y1": 274.0,
+ "r_x2": 105.66666666666666,
+ "r_y2": 274.0,
+ "r_x3": 105.66666666666666,
+ "r_y3": 385.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 12,
+ "label": "text",
+ "bbox": {
+ "l": 137.0,
+ "t": 292.66666666666663,
+ "r": 153.0,
+ "b": 363.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
+ {
+ "index": 11,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 153.0,
+ "r_y0": 363.0,
+ "r_x1": 153.0,
+ "r_y1": 292.66666666666663,
+ "r_x2": 137.0,
+ "r_y2": 292.66666666666663,
+ "r_x3": 137.0,
+ "r_y3": 363.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "column",
+ "orig": "column",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 13,
+ "label": "text",
+ "bbox": {
+ "l": 188.33333333333331,
+ "t": 278.0,
+ "r": 204.33333333333334,
+ "b": 384.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 12,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 204.33333333333334,
+ "r_y0": 384.0,
+ "r_x1": 204.33333333333334,
+ "r_y1": 278.0,
+ "r_x2": 188.33333333333331,
+ "r_y2": 278.0,
+ "r_x3": 188.33333333333331,
+ "r_y3": 384.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 14,
+ "label": "text",
+ "bbox": {
+ "l": 220.0,
+ "t": 304.33333333333337,
+ "r": 236.0,
+ "b": 351.33333333333337,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 236.0,
+ "r_y0": 351.33333333333337,
+ "r_x1": 236.0,
+ "r_y1": 304.33333333333337,
+ "r_x2": 220.0,
+ "r_y2": 304.33333333333337,
+ "r_x3": 220.0,
+ "r_y3": 351.33333333333337,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 15,
+ "label": "text",
+ "bbox": {
+ "l": 268.0,
+ "t": 278.0,
+ "r": 284.0,
+ "b": 383.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 284.0,
+ "r_y0": 383.6666666666667,
+ "r_x1": 284.0,
+ "r_y1": 278.0,
+ "r_x2": 268.0,
+ "r_y2": 278.0,
+ "r_x3": 268.0,
+ "r_y3": 383.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 16,
+ "label": "text",
+ "bbox": {
+ "l": 299.66666666666663,
+ "t": 304.33333333333337,
+ "r": 315.33333333333337,
+ "b": 351.33333333333337,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 315.33333333333337,
+ "r_y0": 351.33333333333337,
+ "r_x1": 315.33333333333337,
+ "r_y1": 304.33333333333337,
+ "r_x2": 299.66666666666663,
+ "r_y2": 304.33333333333337,
+ "r_x3": 299.66666666666663,
+ "r_y3": 351.33333333333337,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ }
+ ]
+ },
+ "text": null,
+ "otsl_seq": [
+ "ched",
+ "ched",
+ "ched",
+ "nl",
+ "fcel",
+ "fcel",
+ "fcel",
+ "nl",
+ "fcel",
+ "fcel",
+ "fcel",
+ "nl"
+ ],
+ "num_rows": 0,
+ "num_cols": 0,
+ "table_cells": []
+ }
+ }
},
"figures_classification": null,
"equations_prediction": null,
@@ -1533,20 +2618,20 @@
"assembled": {
"elements": [
{
- "label": "section_header",
- "id": 9,
+ "label": "table",
+ "id": 0,
"page_no": 0,
"cluster": {
- "id": 9,
- "label": "section_header",
+ "id": 0,
+ "label": "table",
"bbox": {
- "l": 72.850723,
- "t": 194.03978999999998,
- "r": 101.89737999999998,
- "b": 410.7366,
+ "l": 87.64582824707031,
+ "t": 240.90216064453125,
+ "r": 334.5821228027344,
+ "b": 722.9614028930664,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.6652874946594238,
+ "confidence": 0.9790208339691162,
"cells": [
{
"index": 0,
@@ -1557,43 +2642,22 @@
"a": 255
},
"rect": {
- "r_x0": 72.850723,
- "r_y0": 410.7366,
- "r_x1": 101.89737999999998,
- "r_y1": 410.7366,
- "r_x2": 101.89737999999998,
- "r_y2": 194.03978999999998,
- "r_x3": 72.850723,
- "r_y3": 194.03978999999998,
+ "r_x0": 126.33333333333334,
+ "r_y0": 694.6666666666666,
+ "r_x1": 126.33333333333334,
+ "r_y1": 602.0,
+ "r_x2": 105.66666666666666,
+ "r_y2": 602.0,
+ "r_x3": 105.66666666666666,
+ "r_y3": 694.6666666666666,
"coord_origin": "TOPLEFT"
},
- "text": "This is a table test ",
- "orig": "This is a table test ",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- }
- ],
- "children": []
- },
- "text": "This is a table test"
- },
- {
- "label": "text",
- "id": 7,
- "page_no": 0,
- "cluster": {
- "id": 7,
- "label": "text",
- "bbox": {
- "l": 124.28839,
- "t": 235.72681,
- "r": 136.57715,
- "b": 540.000015,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.8457421064376831,
- "cells": [
+ "confidence": 90.0,
+ "from_ocr": true
+ },
{
"index": 1,
"rgba": {
@@ -1603,43 +2667,22 @@
"a": 255
},
"rect": {
- "r_x0": 124.28839,
- "r_y0": 540.000015,
- "r_x1": 136.57715,
- "r_y1": 540.000015,
- "r_x2": 136.57715,
- "r_y2": 235.72681,
- "r_x3": 124.28839,
- "r_y3": 235.72681,
+ "r_x0": 157.66666666666669,
+ "r_y0": 680.3333333333334,
+ "r_x1": 157.66666666666669,
+ "r_y1": 610.0,
+ "r_x2": 137.0,
+ "r_y2": 610.0,
+ "r_x3": 137.0,
+ "r_y3": 680.3333333333334,
"coord_origin": "TOPLEFT"
},
- "text": "Theteststartswithsomerandomtextandthenatableimage: ",
- "orig": "Theteststartswithsomerandomtextandthenatableimage: ",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- }
- ],
- "children": []
- },
- "text": "Theteststartswithsomerandomtextandthenatableimage:"
- },
- {
- "label": "form",
- "id": 8,
- "page_no": 0,
- "cluster": {
- "id": 8,
- "label": "form",
- "bbox": {
- "l": 182.33333333333334,
- "t": 133.0,
- "r": 283.66666666666663,
- "b": 451.6666666666667,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.7344542741775513,
- "cells": [
+ "confidence": 92.0,
+ "from_ocr": true
+ },
{
"index": 2,
"rgba": {
@@ -1649,20 +2692,20 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 337.0,
- "r_x1": 191.0,
- "r_y1": 308.0,
- "r_x2": 182.33333333333334,
- "r_y2": 308.0,
- "r_x3": 182.33333333333334,
- "r_y3": 337.0,
+ "r_x0": 220.0,
+ "r_y0": 670.3333333333334,
+ "r_x1": 220.0,
+ "r_y1": 623.3333333333334,
+ "r_x2": 204.0,
+ "r_y2": 623.3333333333334,
+ "r_x3": 204.0,
+ "r_y3": 670.3333333333334,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9576889799999999,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -1674,20 +2717,20 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 304.0,
- "r_x1": 191.0,
- "r_y1": 268.33333333333337,
- "r_x2": 182.33333333333334,
- "r_y2": 268.33333333333337,
- "r_x3": 182.33333333333334,
- "r_y3": 304.0,
+ "r_x0": 300.0,
+ "r_y0": 670.3333333333334,
+ "r_x1": 300.0,
+ "r_y1": 623.3333333333334,
+ "r_x2": 284.0,
+ "r_y2": 623.3333333333334,
+ "r_x3": 284.0,
+ "r_y3": 670.3333333333334,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9576889799999999,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -1699,20 +2742,20 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 230.66666666666666,
- "r_x1": 191.0,
- "r_y1": 201.66666666666669,
- "r_x2": 182.33333333333334,
- "r_y2": 201.66666666666669,
- "r_x3": 182.33333333333334,
- "r_y3": 230.66666666666666,
+ "r_x0": 126.33333333333334,
+ "r_y0": 559.6666666666667,
+ "r_x1": 126.33333333333334,
+ "r_y1": 428.0,
+ "r_x2": 105.66666666666666,
+ "r_y2": 428.0,
+ "r_x3": 105.66666666666666,
+ "r_y3": 559.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 0.9617948900000001,
+ "confidence": 91.0,
"from_ocr": true
},
{
@@ -1724,20 +2767,20 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 197.66666666666669,
- "r_x1": 191.0,
- "r_y1": 172.0,
- "r_x2": 182.33333333333334,
- "r_y2": 172.0,
- "r_x3": 182.33333333333334,
- "r_y3": 197.66666666666669,
+ "r_x0": 153.0,
+ "r_y0": 526.6666666666667,
+ "r_x1": 153.0,
+ "r_y1": 456.0,
+ "r_x2": 137.0,
+ "r_y2": 456.0,
+ "r_x3": 137.0,
+ "r_y3": 526.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.96105423,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -1749,20 +2792,20 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 168.66666666666669,
- "r_x1": 191.0,
- "r_y1": 133.0,
- "r_x2": 182.33333333333334,
- "r_y2": 133.0,
- "r_x3": 182.33333333333334,
- "r_y3": 168.66666666666669,
+ "r_x0": 204.33333333333334,
+ "r_y0": 545.0,
+ "r_x1": 204.33333333333334,
+ "r_y1": 442.3333333333333,
+ "r_x2": 188.33333333333331,
+ "r_y2": 442.3333333333333,
+ "r_x3": 188.33333333333331,
+ "r_y3": 545.0,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.95868614,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -1774,20 +2817,20 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 437.3333333333333,
- "r_x1": 237.33333333333331,
- "r_y1": 408.3333333333333,
- "r_x2": 228.66666666666669,
- "r_y2": 408.3333333333333,
- "r_x3": 228.66666666666669,
- "r_y3": 437.3333333333333,
+ "r_x0": 236.0,
+ "r_y0": 515.0,
+ "r_x1": 236.0,
+ "r_y1": 468.0,
+ "r_x2": 220.0,
+ "r_y2": 468.0,
+ "r_x3": 220.0,
+ "r_y3": 515.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9579908,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -1799,20 +2842,20 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 404.0,
- "r_x1": 237.33333333333331,
- "r_y1": 386.3333333333333,
- "r_x2": 231.0,
- "r_y2": 386.3333333333333,
- "r_x3": 231.0,
- "r_y3": 404.0,
+ "r_x0": 284.0,
+ "r_y0": 545.0,
+ "r_x1": 284.0,
+ "r_y1": 442.3333333333333,
+ "r_x2": 268.0,
+ "r_y2": 442.3333333333333,
+ "r_x3": 268.0,
+ "r_y3": 545.0,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.96640068,
+ "confidence": 93.0,
"from_ocr": true
},
{
@@ -1824,20 +2867,20 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 326.33333333333337,
- "r_x1": 237.33333333333331,
- "r_y1": 299.0,
- "r_x2": 231.0,
- "r_y2": 299.0,
- "r_x3": 231.0,
- "r_y3": 326.33333333333337,
+ "r_x0": 315.33333333333337,
+ "r_y0": 515.0,
+ "r_x1": 315.33333333333337,
+ "r_y1": 468.0,
+ "r_x2": 299.66666666666663,
+ "r_y2": 468.0,
+ "r_x3": 299.66666666666663,
+ "r_y3": 515.0,
"coord_origin": "TOPLEFT"
},
- "text": "some",
- "orig": "some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96376541,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -1849,20 +2892,20 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 295.33333333333337,
- "r_x1": 237.33333333333331,
- "r_y1": 279.0,
- "r_x2": 228.66666666666669,
- "r_y2": 279.0,
- "r_x3": 228.66666666666669,
- "r_y3": 295.33333333333337,
+ "r_x0": 121.66666666666666,
+ "r_y0": 385.6666666666667,
+ "r_x1": 121.66666666666666,
+ "r_y1": 274.0,
+ "r_x2": 105.66666666666666,
+ "r_y2": 274.0,
+ "r_x3": 105.66666666666666,
+ "r_y3": 385.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "cell",
- "orig": "cell",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.95824509,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -1874,20 +2917,20 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 213.66666666666666,
- "r_x1": 237.33333333333331,
- "r_y1": 190.0,
- "r_x2": 228.66666666666669,
- "r_y2": 190.0,
- "r_x3": 228.66666666666669,
- "r_y3": 213.66666666666666,
+ "r_x0": 153.0,
+ "r_y0": 363.0,
+ "r_x1": 153.0,
+ "r_y1": 292.66666666666663,
+ "r_x2": 137.0,
+ "r_y2": 292.66666666666663,
+ "r_x3": 137.0,
+ "r_y3": 363.0,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9643471499999999,
+ "confidence": 94.0,
"from_ocr": true
},
{
@@ -1899,20 +2942,20 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 186.0,
- "r_x1": 237.33333333333331,
- "r_y1": 149.0,
- "r_x2": 229.0,
- "r_y2": 149.0,
- "r_x3": 229.0,
- "r_y3": 186.0,
+ "r_x0": 204.33333333333334,
+ "r_y0": 384.0,
+ "r_x1": 204.33333333333334,
+ "r_y1": 278.0,
+ "r_x2": 188.33333333333331,
+ "r_y2": 278.0,
+ "r_x3": 188.33333333333331,
+ "r_y3": 384.0,
"coord_origin": "TOPLEFT"
},
- "text": "content",
- "orig": "content",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.96289528,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -1924,20 +2967,20 @@
"a": 255
},
"rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 451.6666666666667,
- "r_x1": 283.66666666666663,
- "r_y1": 422.6666666666667,
- "r_x2": 275.0,
- "r_y2": 422.6666666666667,
- "r_x3": 275.0,
- "r_y3": 451.6666666666667,
+ "r_x0": 236.0,
+ "r_y0": 351.33333333333337,
+ "r_x1": 236.0,
+ "r_y1": 304.33333333333337,
+ "r_x2": 220.0,
+ "r_y2": 304.33333333333337,
+ "r_x3": 220.0,
+ "r_y3": 351.33333333333337,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9611363199999999,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -1949,20 +2992,20 @@
"a": 255
},
"rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 419.0,
- "r_x1": 283.66666666666663,
- "r_y1": 393.0,
- "r_x2": 275.0,
- "r_y2": 393.0,
- "r_x3": 275.0,
- "r_y3": 419.0,
+ "r_x0": 284.0,
+ "r_y0": 383.6666666666667,
+ "r_x1": 284.0,
+ "r_y1": 278.0,
+ "r_x2": 268.0,
+ "r_y2": 278.0,
+ "r_x3": 268.0,
+ "r_y3": 383.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.9588653600000001,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -1974,85 +3017,115 @@
"a": 255
},
"rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 389.3333333333333,
- "r_x1": 283.66666666666663,
- "r_y1": 371.6666666666667,
- "r_x2": 277.33333333333337,
- "r_y2": 371.6666666666667,
- "r_x3": 277.33333333333337,
- "r_y3": 389.3333333333333,
+ "r_x0": 315.33333333333337,
+ "r_y0": 351.33333333333337,
+ "r_x1": 315.33333333333337,
+ "r_y1": 304.33333333333337,
+ "r_x2": 299.66666666666663,
+ "r_y2": 304.33333333333337,
+ "r_x3": 299.66666666666663,
+ "r_y3": 351.33333333333337,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.95681549,
- "from_ocr": true
- },
- {
- "index": 16,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 329.0,
- "r_x1": 283.66666666666663,
- "r_y1": 303.0,
- "r_x2": 275.0,
- "r_y2": 303.0,
- "r_x3": 275.0,
- "r_y3": 329.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.9589106,
- "from_ocr": true
- },
- {
- "index": 17,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 299.66666666666663,
- "r_x1": 283.66666666666663,
- "r_y1": 275.66666666666663,
- "r_x2": 275.0,
- "r_y2": 275.66666666666663,
- "r_x3": 275.0,
- "r_y3": 299.66666666666663,
- "coord_origin": "TOPLEFT"
- },
- "text": "don't",
- "orig": "don't",
- "text_direction": "left_to_right",
- "confidence": 0.96121948,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": [
{
- "id": 4,
+ "id": 1,
"label": "text",
"bbox": {
- "l": 182.33333333333334,
- "t": 268.33333333333337,
- "r": 191.0,
- "b": 337.0,
+ "l": 105.66666666666666,
+ "t": 602.0,
+ "r": 126.33333333333334,
+ "b": 694.6666666666666,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9089116454124451,
+ "confidence": 90.0,
+ "cells": [
+ {
+ "index": 0,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 126.33333333333334,
+ "r_y0": 694.6666666666666,
+ "r_x1": 126.33333333333334,
+ "r_y1": 602.0,
+ "r_x2": 105.66666666666666,
+ "r_y2": 602.0,
+ "r_x3": 105.66666666666666,
+ "r_y3": 694.6666666666666,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Vertically",
+ "orig": "Vertically",
+ "text_direction": "left_to_right",
+ "confidence": 90.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 2,
+ "label": "text",
+ "bbox": {
+ "l": 137.0,
+ "t": 610.0,
+ "r": 157.66666666666669,
+ "b": 680.3333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 92.0,
+ "cells": [
+ {
+ "index": 1,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 157.66666666666669,
+ "r_y0": 680.3333333333334,
+ "r_x1": 157.66666666666669,
+ "r_y1": 610.0,
+ "r_x2": 137.0,
+ "r_y2": 610.0,
+ "r_x3": 137.0,
+ "r_y3": 680.3333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "merged",
+ "orig": "merged",
+ "text_direction": "left_to_right",
+ "confidence": 92.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 3,
+ "label": "text",
+ "bbox": {
+ "l": 204.0,
+ "t": 623.3333333333334,
+ "r": 220.0,
+ "b": 670.3333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
"cells": [
{
"index": 2,
@@ -2063,22 +3136,37 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 337.0,
- "r_x1": 191.0,
- "r_y1": 308.0,
- "r_x2": 182.33333333333334,
- "r_y2": 308.0,
- "r_x3": 182.33333333333334,
- "r_y3": 337.0,
+ "r_x0": 220.0,
+ "r_y0": 670.3333333333334,
+ "r_x1": 220.0,
+ "r_y1": 623.3333333333334,
+ "r_x2": 204.0,
+ "r_y2": 623.3333333333334,
+ "r_x3": 204.0,
+ "r_y3": 670.3333333333334,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9576889799999999,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 4,
+ "label": "text",
+ "bbox": {
+ "l": 284.0,
+ "t": 623.3333333333334,
+ "r": 300.0,
+ "b": 670.3333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
{
"index": 3,
"rgba": {
@@ -2088,20 +3176,20 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 304.0,
- "r_x1": 191.0,
- "r_y1": 268.33333333333337,
- "r_x2": 182.33333333333334,
- "r_y2": 268.33333333333337,
- "r_x3": 182.33333333333334,
- "r_y3": 304.0,
+ "r_x0": 300.0,
+ "r_y0": 670.3333333333334,
+ "r_x1": 300.0,
+ "r_y1": 623.3333333333334,
+ "r_x2": 284.0,
+ "r_y2": 623.3333333333334,
+ "r_x3": 284.0,
+ "r_y3": 670.3333333333334,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9576889799999999,
+ "confidence": 96.0,
"from_ocr": true
}
],
@@ -2111,13 +3199,13 @@
"id": 5,
"label": "text",
"bbox": {
- "l": 182.33333333333334,
- "t": 133.0,
- "r": 191.0,
- "b": 230.66666666666666,
+ "l": 105.66666666666666,
+ "t": 428.0,
+ "r": 126.33333333333334,
+ "b": 559.6666666666667,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9040389060974121,
+ "confidence": 91.0,
"cells": [
{
"index": 4,
@@ -2128,22 +3216,37 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 230.66666666666666,
- "r_x1": 191.0,
- "r_y1": 201.66666666666669,
- "r_x2": 182.33333333333334,
- "r_y2": 201.66666666666669,
- "r_x3": 182.33333333333334,
- "r_y3": 230.66666666666666,
+ "r_x0": 126.33333333333334,
+ "r_y0": 559.6666666666667,
+ "r_x1": 126.33333333333334,
+ "r_y1": 428.0,
+ "r_x2": 105.66666666666666,
+ "r_y2": 428.0,
+ "r_x3": 105.66666666666666,
+ "r_y3": 559.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 0.9617948900000001,
+ "confidence": 91.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 6,
+ "label": "text",
+ "bbox": {
+ "l": 137.0,
+ "t": 456.0,
+ "r": 153.0,
+ "b": 526.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 5,
"rgba": {
@@ -2153,22 +3256,37 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 197.66666666666669,
- "r_x1": 191.0,
- "r_y1": 172.0,
- "r_x2": 182.33333333333334,
- "r_y2": 172.0,
- "r_x3": 182.33333333333334,
- "r_y3": 197.66666666666669,
+ "r_x0": 153.0,
+ "r_y0": 526.6666666666667,
+ "r_x1": 153.0,
+ "r_y1": 456.0,
+ "r_x2": 137.0,
+ "r_y2": 456.0,
+ "r_x3": 137.0,
+ "r_y3": 526.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.96105423,
+ "confidence": 95.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 7,
+ "label": "text",
+ "bbox": {
+ "l": 188.33333333333331,
+ "t": 442.3333333333333,
+ "r": 204.33333333333334,
+ "b": 545.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 6,
"rgba": {
@@ -2178,36 +3296,36 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 168.66666666666669,
- "r_x1": 191.0,
- "r_y1": 133.0,
- "r_x2": 182.33333333333334,
- "r_y2": 133.0,
- "r_x3": 182.33333333333334,
- "r_y3": 168.66666666666669,
+ "r_x0": 204.33333333333334,
+ "r_y0": 545.0,
+ "r_x1": 204.33333333333334,
+ "r_y1": 442.3333333333333,
+ "r_x2": 188.33333333333331,
+ "r_y2": 442.3333333333333,
+ "r_x3": 188.33333333333331,
+ "r_y3": 545.0,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.95868614,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 0,
+ "id": 8,
"label": "text",
"bbox": {
- "l": 228.66666666666669,
- "t": 386.3333333333333,
- "r": 237.33333333333331,
- "b": 437.3333333333333,
+ "l": 220.0,
+ "t": 468.0,
+ "r": 236.0,
+ "b": 515.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9155756235122681,
+ "confidence": 96.0,
"cells": [
{
"index": 7,
@@ -2218,22 +3336,37 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 437.3333333333333,
- "r_x1": 237.33333333333331,
- "r_y1": 408.3333333333333,
- "r_x2": 228.66666666666669,
- "r_y2": 408.3333333333333,
- "r_x3": 228.66666666666669,
- "r_y3": 437.3333333333333,
+ "r_x0": 236.0,
+ "r_y0": 515.0,
+ "r_x1": 236.0,
+ "r_y1": 468.0,
+ "r_x2": 220.0,
+ "r_y2": 468.0,
+ "r_x3": 220.0,
+ "r_y3": 515.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9579908,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 9,
+ "label": "text",
+ "bbox": {
+ "l": 268.0,
+ "t": 442.3333333333333,
+ "r": 284.0,
+ "b": 545.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 93.0,
+ "cells": [
{
"index": 8,
"rgba": {
@@ -2243,36 +3376,36 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 404.0,
- "r_x1": 237.33333333333331,
- "r_y1": 386.3333333333333,
- "r_x2": 231.0,
- "r_y2": 386.3333333333333,
- "r_x3": 231.0,
- "r_y3": 404.0,
+ "r_x0": 284.0,
+ "r_y0": 545.0,
+ "r_x1": 284.0,
+ "r_y1": 442.3333333333333,
+ "r_x2": 268.0,
+ "r_y2": 442.3333333333333,
+ "r_x3": 268.0,
+ "r_y3": 545.0,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.96640068,
+ "confidence": 93.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 2,
+ "id": 10,
"label": "text",
"bbox": {
- "l": 228.66666666666669,
- "t": 279.0,
- "r": 237.33333333333331,
- "b": 326.33333333333337,
+ "l": 299.66666666666663,
+ "t": 468.0,
+ "r": 315.33333333333337,
+ "b": 515.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9143174290657043,
+ "confidence": 96.0,
"cells": [
{
"index": 9,
@@ -2283,22 +3416,37 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 326.33333333333337,
- "r_x1": 237.33333333333331,
- "r_y1": 299.0,
- "r_x2": 231.0,
- "r_y2": 299.0,
- "r_x3": 231.0,
- "r_y3": 326.33333333333337,
+ "r_x0": 315.33333333333337,
+ "r_y0": 515.0,
+ "r_x1": 315.33333333333337,
+ "r_y1": 468.0,
+ "r_x2": 299.66666666666663,
+ "r_y2": 468.0,
+ "r_x3": 299.66666666666663,
+ "r_y3": 515.0,
"coord_origin": "TOPLEFT"
},
- "text": "some",
- "orig": "some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96376541,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 11,
+ "label": "text",
+ "bbox": {
+ "l": 105.66666666666666,
+ "t": 274.0,
+ "r": 121.66666666666666,
+ "b": 385.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 10,
"rgba": {
@@ -2308,36 +3456,36 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 295.33333333333337,
- "r_x1": 237.33333333333331,
- "r_y1": 279.0,
- "r_x2": 228.66666666666669,
- "r_y2": 279.0,
- "r_x3": 228.66666666666669,
- "r_y3": 295.33333333333337,
+ "r_x0": 121.66666666666666,
+ "r_y0": 385.6666666666667,
+ "r_x1": 121.66666666666666,
+ "r_y1": 274.0,
+ "r_x2": 105.66666666666666,
+ "r_y2": 274.0,
+ "r_x3": 105.66666666666666,
+ "r_y3": 385.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "cell",
- "orig": "cell",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.95824509,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 6,
+ "id": 12,
"label": "text",
"bbox": {
- "l": 228.66666666666669,
- "t": 149.0,
- "r": 237.33333333333331,
- "b": 213.66666666666666,
+ "l": 137.0,
+ "t": 292.66666666666663,
+ "r": 153.0,
+ "b": 363.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9003775715827942,
+ "confidence": 94.0,
"cells": [
{
"index": 11,
@@ -2348,22 +3496,37 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 213.66666666666666,
- "r_x1": 237.33333333333331,
- "r_y1": 190.0,
- "r_x2": 228.66666666666669,
- "r_y2": 190.0,
- "r_x3": 228.66666666666669,
- "r_y3": 213.66666666666666,
+ "r_x0": 153.0,
+ "r_y0": 363.0,
+ "r_x1": 153.0,
+ "r_y1": 292.66666666666663,
+ "r_x2": 137.0,
+ "r_y2": 292.66666666666663,
+ "r_x3": 137.0,
+ "r_y3": 363.0,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9643471499999999,
+ "confidence": 94.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 13,
+ "label": "text",
+ "bbox": {
+ "l": 188.33333333333331,
+ "t": 278.0,
+ "r": 204.33333333333334,
+ "b": 384.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 12,
"rgba": {
@@ -2373,36 +3536,36 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 186.0,
- "r_x1": 237.33333333333331,
- "r_y1": 149.0,
- "r_x2": 229.0,
- "r_y2": 149.0,
- "r_x3": 229.0,
- "r_y3": 186.0,
+ "r_x0": 204.33333333333334,
+ "r_y0": 384.0,
+ "r_x1": 204.33333333333334,
+ "r_y1": 278.0,
+ "r_x2": 188.33333333333331,
+ "r_y2": 278.0,
+ "r_x3": 188.33333333333331,
+ "r_y3": 384.0,
"coord_origin": "TOPLEFT"
},
- "text": "content",
- "orig": "content",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.96289528,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 1,
+ "id": 14,
"label": "text",
"bbox": {
- "l": 275.0,
- "t": 371.6666666666667,
- "r": 283.66666666666663,
- "b": 451.6666666666667,
+ "l": 220.0,
+ "t": 304.33333333333337,
+ "r": 236.0,
+ "b": 351.33333333333337,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9147250652313232,
+ "confidence": 95.0,
"cells": [
{
"index": 13,
@@ -2413,22 +3576,37 @@
"a": 255
},
"rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 451.6666666666667,
- "r_x1": 283.66666666666663,
- "r_y1": 422.6666666666667,
- "r_x2": 275.0,
- "r_y2": 422.6666666666667,
- "r_x3": 275.0,
- "r_y3": 451.6666666666667,
+ "r_x0": 236.0,
+ "r_y0": 351.33333333333337,
+ "r_x1": 236.0,
+ "r_y1": 304.33333333333337,
+ "r_x2": 220.0,
+ "r_y2": 304.33333333333337,
+ "r_x3": 220.0,
+ "r_y3": 351.33333333333337,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9611363199999999,
+ "confidence": 95.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 15,
+ "label": "text",
+ "bbox": {
+ "l": 268.0,
+ "t": 278.0,
+ "r": 284.0,
+ "b": 383.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 14,
"rgba": {
@@ -2438,22 +3616,37 @@
"a": 255
},
"rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 419.0,
- "r_x1": 283.66666666666663,
- "r_y1": 393.0,
- "r_x2": 275.0,
- "r_y2": 393.0,
- "r_x3": 275.0,
- "r_y3": 419.0,
+ "r_x0": 284.0,
+ "r_y0": 383.6666666666667,
+ "r_x1": 284.0,
+ "r_y1": 278.0,
+ "r_x2": 268.0,
+ "r_y2": 278.0,
+ "r_x3": 268.0,
+ "r_y3": 383.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.9588653600000001,
+ "confidence": 95.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 16,
+ "label": "text",
+ "bbox": {
+ "l": 299.66666666666663,
+ "t": 304.33333333333337,
+ "r": 315.33333333333337,
+ "b": 351.33333333333337,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 15,
"rgba": {
@@ -2463,85 +3656,20 @@
"a": 255
},
"rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 389.3333333333333,
- "r_x1": 283.66666666666663,
- "r_y1": 371.6666666666667,
- "r_x2": 277.33333333333337,
- "r_y2": 371.6666666666667,
- "r_x3": 277.33333333333337,
- "r_y3": 389.3333333333333,
+ "r_x0": 315.33333333333337,
+ "r_y0": 351.33333333333337,
+ "r_x1": 315.33333333333337,
+ "r_y1": 304.33333333333337,
+ "r_x2": 299.66666666666663,
+ "r_y2": 304.33333333333337,
+ "r_x3": 299.66666666666663,
+ "r_y3": 351.33333333333337,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.95681549,
- "from_ocr": true
- }
- ],
- "children": []
- },
- {
- "id": 3,
- "label": "text",
- "bbox": {
- "l": 275.0,
- "t": 275.66666666666663,
- "r": 283.66666666666663,
- "b": 329.0,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.9124712347984314,
- "cells": [
- {
- "index": 16,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 329.0,
- "r_x1": 283.66666666666663,
- "r_y1": 303.0,
- "r_x2": 275.0,
- "r_y2": 303.0,
- "r_x3": 275.0,
- "r_y3": 329.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.9589106,
- "from_ocr": true
- },
- {
- "index": 17,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 299.66666666666663,
- "r_x1": 283.66666666666663,
- "r_y1": 275.66666666666663,
- "r_x2": 275.0,
- "r_y2": 275.66666666666663,
- "r_x3": 275.0,
- "r_y3": 299.66666666666663,
- "coord_origin": "TOPLEFT"
- },
- "text": "don't",
- "orig": "don't",
- "text_direction": "left_to_right",
- "confidence": 0.96121948,
+ "confidence": 95.0,
"from_ocr": true
}
],
@@ -2549,25 +3677,42 @@
}
]
},
- "text": null
+ "text": null,
+ "otsl_seq": [
+ "ched",
+ "ched",
+ "ched",
+ "nl",
+ "fcel",
+ "fcel",
+ "fcel",
+ "nl",
+ "fcel",
+ "fcel",
+ "fcel",
+ "nl"
+ ],
+ "num_rows": 0,
+ "num_cols": 0,
+ "table_cells": []
}
],
"body": [
{
- "label": "section_header",
- "id": 9,
+ "label": "table",
+ "id": 0,
"page_no": 0,
"cluster": {
- "id": 9,
- "label": "section_header",
+ "id": 0,
+ "label": "table",
"bbox": {
- "l": 72.850723,
- "t": 194.03978999999998,
- "r": 101.89737999999998,
- "b": 410.7366,
+ "l": 87.64582824707031,
+ "t": 240.90216064453125,
+ "r": 334.5821228027344,
+ "b": 722.9614028930664,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.6652874946594238,
+ "confidence": 0.9790208339691162,
"cells": [
{
"index": 0,
@@ -2578,43 +3723,22 @@
"a": 255
},
"rect": {
- "r_x0": 72.850723,
- "r_y0": 410.7366,
- "r_x1": 101.89737999999998,
- "r_y1": 410.7366,
- "r_x2": 101.89737999999998,
- "r_y2": 194.03978999999998,
- "r_x3": 72.850723,
- "r_y3": 194.03978999999998,
+ "r_x0": 126.33333333333334,
+ "r_y0": 694.6666666666666,
+ "r_x1": 126.33333333333334,
+ "r_y1": 602.0,
+ "r_x2": 105.66666666666666,
+ "r_y2": 602.0,
+ "r_x3": 105.66666666666666,
+ "r_y3": 694.6666666666666,
"coord_origin": "TOPLEFT"
},
- "text": "This is a table test ",
- "orig": "This is a table test ",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- }
- ],
- "children": []
- },
- "text": "This is a table test"
- },
- {
- "label": "text",
- "id": 7,
- "page_no": 0,
- "cluster": {
- "id": 7,
- "label": "text",
- "bbox": {
- "l": 124.28839,
- "t": 235.72681,
- "r": 136.57715,
- "b": 540.000015,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.8457421064376831,
- "cells": [
+ "confidence": 90.0,
+ "from_ocr": true
+ },
{
"index": 1,
"rgba": {
@@ -2624,43 +3748,22 @@
"a": 255
},
"rect": {
- "r_x0": 124.28839,
- "r_y0": 540.000015,
- "r_x1": 136.57715,
- "r_y1": 540.000015,
- "r_x2": 136.57715,
- "r_y2": 235.72681,
- "r_x3": 124.28839,
- "r_y3": 235.72681,
+ "r_x0": 157.66666666666669,
+ "r_y0": 680.3333333333334,
+ "r_x1": 157.66666666666669,
+ "r_y1": 610.0,
+ "r_x2": 137.0,
+ "r_y2": 610.0,
+ "r_x3": 137.0,
+ "r_y3": 680.3333333333334,
"coord_origin": "TOPLEFT"
},
- "text": "Theteststartswithsomerandomtextandthenatableimage: ",
- "orig": "Theteststartswithsomerandomtextandthenatableimage: ",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
- }
- ],
- "children": []
- },
- "text": "Theteststartswithsomerandomtextandthenatableimage:"
- },
- {
- "label": "form",
- "id": 8,
- "page_no": 0,
- "cluster": {
- "id": 8,
- "label": "form",
- "bbox": {
- "l": 182.33333333333334,
- "t": 133.0,
- "r": 283.66666666666663,
- "b": 451.6666666666667,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.7344542741775513,
- "cells": [
+ "confidence": 92.0,
+ "from_ocr": true
+ },
{
"index": 2,
"rgba": {
@@ -2670,20 +3773,20 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 337.0,
- "r_x1": 191.0,
- "r_y1": 308.0,
- "r_x2": 182.33333333333334,
- "r_y2": 308.0,
- "r_x3": 182.33333333333334,
- "r_y3": 337.0,
+ "r_x0": 220.0,
+ "r_y0": 670.3333333333334,
+ "r_x1": 220.0,
+ "r_y1": 623.3333333333334,
+ "r_x2": 204.0,
+ "r_y2": 623.3333333333334,
+ "r_x3": 204.0,
+ "r_y3": 670.3333333333334,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9576889799999999,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -2695,20 +3798,20 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 304.0,
- "r_x1": 191.0,
- "r_y1": 268.33333333333337,
- "r_x2": 182.33333333333334,
- "r_y2": 268.33333333333337,
- "r_x3": 182.33333333333334,
- "r_y3": 304.0,
+ "r_x0": 300.0,
+ "r_y0": 670.3333333333334,
+ "r_x1": 300.0,
+ "r_y1": 623.3333333333334,
+ "r_x2": 284.0,
+ "r_y2": 623.3333333333334,
+ "r_x3": 284.0,
+ "r_y3": 670.3333333333334,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9576889799999999,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -2720,20 +3823,20 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 230.66666666666666,
- "r_x1": 191.0,
- "r_y1": 201.66666666666669,
- "r_x2": 182.33333333333334,
- "r_y2": 201.66666666666669,
- "r_x3": 182.33333333333334,
- "r_y3": 230.66666666666666,
+ "r_x0": 126.33333333333334,
+ "r_y0": 559.6666666666667,
+ "r_x1": 126.33333333333334,
+ "r_y1": 428.0,
+ "r_x2": 105.66666666666666,
+ "r_y2": 428.0,
+ "r_x3": 105.66666666666666,
+ "r_y3": 559.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 0.9617948900000001,
+ "confidence": 91.0,
"from_ocr": true
},
{
@@ -2745,20 +3848,20 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 197.66666666666669,
- "r_x1": 191.0,
- "r_y1": 172.0,
- "r_x2": 182.33333333333334,
- "r_y2": 172.0,
- "r_x3": 182.33333333333334,
- "r_y3": 197.66666666666669,
+ "r_x0": 153.0,
+ "r_y0": 526.6666666666667,
+ "r_x1": 153.0,
+ "r_y1": 456.0,
+ "r_x2": 137.0,
+ "r_y2": 456.0,
+ "r_x3": 137.0,
+ "r_y3": 526.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.96105423,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -2770,20 +3873,20 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 168.66666666666669,
- "r_x1": 191.0,
- "r_y1": 133.0,
- "r_x2": 182.33333333333334,
- "r_y2": 133.0,
- "r_x3": 182.33333333333334,
- "r_y3": 168.66666666666669,
+ "r_x0": 204.33333333333334,
+ "r_y0": 545.0,
+ "r_x1": 204.33333333333334,
+ "r_y1": 442.3333333333333,
+ "r_x2": 188.33333333333331,
+ "r_y2": 442.3333333333333,
+ "r_x3": 188.33333333333331,
+ "r_y3": 545.0,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.95868614,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -2795,20 +3898,20 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 437.3333333333333,
- "r_x1": 237.33333333333331,
- "r_y1": 408.3333333333333,
- "r_x2": 228.66666666666669,
- "r_y2": 408.3333333333333,
- "r_x3": 228.66666666666669,
- "r_y3": 437.3333333333333,
+ "r_x0": 236.0,
+ "r_y0": 515.0,
+ "r_x1": 236.0,
+ "r_y1": 468.0,
+ "r_x2": 220.0,
+ "r_y2": 468.0,
+ "r_x3": 220.0,
+ "r_y3": 515.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9579908,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -2820,20 +3923,20 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 404.0,
- "r_x1": 237.33333333333331,
- "r_y1": 386.3333333333333,
- "r_x2": 231.0,
- "r_y2": 386.3333333333333,
- "r_x3": 231.0,
- "r_y3": 404.0,
+ "r_x0": 284.0,
+ "r_y0": 545.0,
+ "r_x1": 284.0,
+ "r_y1": 442.3333333333333,
+ "r_x2": 268.0,
+ "r_y2": 442.3333333333333,
+ "r_x3": 268.0,
+ "r_y3": 545.0,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.96640068,
+ "confidence": 93.0,
"from_ocr": true
},
{
@@ -2845,20 +3948,20 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 326.33333333333337,
- "r_x1": 237.33333333333331,
- "r_y1": 299.0,
- "r_x2": 231.0,
- "r_y2": 299.0,
- "r_x3": 231.0,
- "r_y3": 326.33333333333337,
+ "r_x0": 315.33333333333337,
+ "r_y0": 515.0,
+ "r_x1": 315.33333333333337,
+ "r_y1": 468.0,
+ "r_x2": 299.66666666666663,
+ "r_y2": 468.0,
+ "r_x3": 299.66666666666663,
+ "r_y3": 515.0,
"coord_origin": "TOPLEFT"
},
- "text": "some",
- "orig": "some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96376541,
+ "confidence": 96.0,
"from_ocr": true
},
{
@@ -2870,20 +3973,20 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 295.33333333333337,
- "r_x1": 237.33333333333331,
- "r_y1": 279.0,
- "r_x2": 228.66666666666669,
- "r_y2": 279.0,
- "r_x3": 228.66666666666669,
- "r_y3": 295.33333333333337,
+ "r_x0": 121.66666666666666,
+ "r_y0": 385.6666666666667,
+ "r_x1": 121.66666666666666,
+ "r_y1": 274.0,
+ "r_x2": 105.66666666666666,
+ "r_y2": 274.0,
+ "r_x3": 105.66666666666666,
+ "r_y3": 385.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "cell",
- "orig": "cell",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.95824509,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -2895,20 +3998,20 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 213.66666666666666,
- "r_x1": 237.33333333333331,
- "r_y1": 190.0,
- "r_x2": 228.66666666666669,
- "r_y2": 190.0,
- "r_x3": 228.66666666666669,
- "r_y3": 213.66666666666666,
+ "r_x0": 153.0,
+ "r_y0": 363.0,
+ "r_x1": 153.0,
+ "r_y1": 292.66666666666663,
+ "r_x2": 137.0,
+ "r_y2": 292.66666666666663,
+ "r_x3": 137.0,
+ "r_y3": 363.0,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9643471499999999,
+ "confidence": 94.0,
"from_ocr": true
},
{
@@ -2920,20 +4023,20 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 186.0,
- "r_x1": 237.33333333333331,
- "r_y1": 149.0,
- "r_x2": 229.0,
- "r_y2": 149.0,
- "r_x3": 229.0,
- "r_y3": 186.0,
+ "r_x0": 204.33333333333334,
+ "r_y0": 384.0,
+ "r_x1": 204.33333333333334,
+ "r_y1": 278.0,
+ "r_x2": 188.33333333333331,
+ "r_y2": 278.0,
+ "r_x3": 188.33333333333331,
+ "r_y3": 384.0,
"coord_origin": "TOPLEFT"
},
- "text": "content",
- "orig": "content",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.96289528,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -2945,20 +4048,20 @@
"a": 255
},
"rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 451.6666666666667,
- "r_x1": 283.66666666666663,
- "r_y1": 422.6666666666667,
- "r_x2": 275.0,
- "r_y2": 422.6666666666667,
- "r_x3": 275.0,
- "r_y3": 451.6666666666667,
+ "r_x0": 236.0,
+ "r_y0": 351.33333333333337,
+ "r_x1": 236.0,
+ "r_y1": 304.33333333333337,
+ "r_x2": 220.0,
+ "r_y2": 304.33333333333337,
+ "r_x3": 220.0,
+ "r_y3": 351.33333333333337,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9611363199999999,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -2970,20 +4073,20 @@
"a": 255
},
"rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 419.0,
- "r_x1": 283.66666666666663,
- "r_y1": 393.0,
- "r_x2": 275.0,
- "r_y2": 393.0,
- "r_x3": 275.0,
- "r_y3": 419.0,
+ "r_x0": 284.0,
+ "r_y0": 383.6666666666667,
+ "r_x1": 284.0,
+ "r_y1": 278.0,
+ "r_x2": 268.0,
+ "r_y2": 278.0,
+ "r_x3": 268.0,
+ "r_y3": 383.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.9588653600000001,
+ "confidence": 95.0,
"from_ocr": true
},
{
@@ -2995,85 +4098,115 @@
"a": 255
},
"rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 389.3333333333333,
- "r_x1": 283.66666666666663,
- "r_y1": 371.6666666666667,
- "r_x2": 277.33333333333337,
- "r_y2": 371.6666666666667,
- "r_x3": 277.33333333333337,
- "r_y3": 389.3333333333333,
+ "r_x0": 315.33333333333337,
+ "r_y0": 351.33333333333337,
+ "r_x1": 315.33333333333337,
+ "r_y1": 304.33333333333337,
+ "r_x2": 299.66666666666663,
+ "r_y2": 304.33333333333337,
+ "r_x3": 299.66666666666663,
+ "r_y3": 351.33333333333337,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.95681549,
- "from_ocr": true
- },
- {
- "index": 16,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 329.0,
- "r_x1": 283.66666666666663,
- "r_y1": 303.0,
- "r_x2": 275.0,
- "r_y2": 303.0,
- "r_x3": 275.0,
- "r_y3": 329.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.9589106,
- "from_ocr": true
- },
- {
- "index": 17,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 299.66666666666663,
- "r_x1": 283.66666666666663,
- "r_y1": 275.66666666666663,
- "r_x2": 275.0,
- "r_y2": 275.66666666666663,
- "r_x3": 275.0,
- "r_y3": 299.66666666666663,
- "coord_origin": "TOPLEFT"
- },
- "text": "don't",
- "orig": "don't",
- "text_direction": "left_to_right",
- "confidence": 0.96121948,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": [
{
- "id": 4,
+ "id": 1,
"label": "text",
"bbox": {
- "l": 182.33333333333334,
- "t": 268.33333333333337,
- "r": 191.0,
- "b": 337.0,
+ "l": 105.66666666666666,
+ "t": 602.0,
+ "r": 126.33333333333334,
+ "b": 694.6666666666666,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9089116454124451,
+ "confidence": 90.0,
+ "cells": [
+ {
+ "index": 0,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 126.33333333333334,
+ "r_y0": 694.6666666666666,
+ "r_x1": 126.33333333333334,
+ "r_y1": 602.0,
+ "r_x2": 105.66666666666666,
+ "r_y2": 602.0,
+ "r_x3": 105.66666666666666,
+ "r_y3": 694.6666666666666,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Vertically",
+ "orig": "Vertically",
+ "text_direction": "left_to_right",
+ "confidence": 90.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 2,
+ "label": "text",
+ "bbox": {
+ "l": 137.0,
+ "t": 610.0,
+ "r": 157.66666666666669,
+ "b": 680.3333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 92.0,
+ "cells": [
+ {
+ "index": 1,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 157.66666666666669,
+ "r_y0": 680.3333333333334,
+ "r_x1": 157.66666666666669,
+ "r_y1": 610.0,
+ "r_x2": 137.0,
+ "r_y2": 610.0,
+ "r_x3": 137.0,
+ "r_y3": 680.3333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "merged",
+ "orig": "merged",
+ "text_direction": "left_to_right",
+ "confidence": 92.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 3,
+ "label": "text",
+ "bbox": {
+ "l": 204.0,
+ "t": 623.3333333333334,
+ "r": 220.0,
+ "b": 670.3333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
"cells": [
{
"index": 2,
@@ -3084,22 +4217,37 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 337.0,
- "r_x1": 191.0,
- "r_y1": 308.0,
- "r_x2": 182.33333333333334,
- "r_y2": 308.0,
- "r_x3": 182.33333333333334,
- "r_y3": 337.0,
+ "r_x0": 220.0,
+ "r_y0": 670.3333333333334,
+ "r_x1": 220.0,
+ "r_y1": 623.3333333333334,
+ "r_x2": 204.0,
+ "r_y2": 623.3333333333334,
+ "r_x3": 204.0,
+ "r_y3": 670.3333333333334,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9576889799999999,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 4,
+ "label": "text",
+ "bbox": {
+ "l": 284.0,
+ "t": 623.3333333333334,
+ "r": 300.0,
+ "b": 670.3333333333334,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
{
"index": 3,
"rgba": {
@@ -3109,20 +4257,20 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 304.0,
- "r_x1": 191.0,
- "r_y1": 268.33333333333337,
- "r_x2": 182.33333333333334,
- "r_y2": 268.33333333333337,
- "r_x3": 182.33333333333334,
- "r_y3": 304.0,
+ "r_x0": 300.0,
+ "r_y0": 670.3333333333334,
+ "r_x1": 300.0,
+ "r_y1": 623.3333333333334,
+ "r_x2": 284.0,
+ "r_y2": 623.3333333333334,
+ "r_x3": 284.0,
+ "r_y3": 670.3333333333334,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9576889799999999,
+ "confidence": 96.0,
"from_ocr": true
}
],
@@ -3132,13 +4280,13 @@
"id": 5,
"label": "text",
"bbox": {
- "l": 182.33333333333334,
- "t": 133.0,
- "r": 191.0,
- "b": 230.66666666666666,
+ "l": 105.66666666666666,
+ "t": 428.0,
+ "r": 126.33333333333334,
+ "b": 559.6666666666667,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9040389060974121,
+ "confidence": 91.0,
"cells": [
{
"index": 4,
@@ -3149,22 +4297,37 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 230.66666666666666,
- "r_x1": 191.0,
- "r_y1": 201.66666666666669,
- "r_x2": 182.33333333333334,
- "r_y2": 201.66666666666669,
- "r_x3": 182.33333333333334,
- "r_y3": 230.66666666666666,
+ "r_x0": 126.33333333333334,
+ "r_y0": 559.6666666666667,
+ "r_x1": 126.33333333333334,
+ "r_y1": 428.0,
+ "r_x2": 105.66666666666666,
+ "r_y2": 428.0,
+ "r_x3": 105.66666666666666,
+ "r_y3": 559.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 0.9617948900000001,
+ "confidence": 91.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 6,
+ "label": "text",
+ "bbox": {
+ "l": 137.0,
+ "t": 456.0,
+ "r": 153.0,
+ "b": 526.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 5,
"rgba": {
@@ -3174,22 +4337,37 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 197.66666666666669,
- "r_x1": 191.0,
- "r_y1": 172.0,
- "r_x2": 182.33333333333334,
- "r_y2": 172.0,
- "r_x3": 182.33333333333334,
- "r_y3": 197.66666666666669,
+ "r_x0": 153.0,
+ "r_y0": 526.6666666666667,
+ "r_x1": 153.0,
+ "r_y1": 456.0,
+ "r_x2": 137.0,
+ "r_y2": 456.0,
+ "r_x3": 137.0,
+ "r_y3": 526.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.96105423,
+ "confidence": 95.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 7,
+ "label": "text",
+ "bbox": {
+ "l": 188.33333333333331,
+ "t": 442.3333333333333,
+ "r": 204.33333333333334,
+ "b": 545.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 6,
"rgba": {
@@ -3199,36 +4377,36 @@
"a": 255
},
"rect": {
- "r_x0": 191.0,
- "r_y0": 168.66666666666669,
- "r_x1": 191.0,
- "r_y1": 133.0,
- "r_x2": 182.33333333333334,
- "r_y2": 133.0,
- "r_x3": 182.33333333333334,
- "r_y3": 168.66666666666669,
+ "r_x0": 204.33333333333334,
+ "r_y0": 545.0,
+ "r_x1": 204.33333333333334,
+ "r_y1": 442.3333333333333,
+ "r_x2": 188.33333333333331,
+ "r_y2": 442.3333333333333,
+ "r_x3": 188.33333333333331,
+ "r_y3": 545.0,
"coord_origin": "TOPLEFT"
},
- "text": "column",
- "orig": "column",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.95868614,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 0,
+ "id": 8,
"label": "text",
"bbox": {
- "l": 228.66666666666669,
- "t": 386.3333333333333,
- "r": 237.33333333333331,
- "b": 437.3333333333333,
+ "l": 220.0,
+ "t": 468.0,
+ "r": 236.0,
+ "b": 515.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9155756235122681,
+ "confidence": 96.0,
"cells": [
{
"index": 7,
@@ -3239,22 +4417,37 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 437.3333333333333,
- "r_x1": 237.33333333333331,
- "r_y1": 408.3333333333333,
- "r_x2": 228.66666666666669,
- "r_y2": 408.3333333333333,
- "r_x3": 228.66666666666669,
- "r_y3": 437.3333333333333,
+ "r_x0": 236.0,
+ "r_y0": 515.0,
+ "r_x1": 236.0,
+ "r_y1": 468.0,
+ "r_x2": 220.0,
+ "r_y2": 468.0,
+ "r_x3": 220.0,
+ "r_y3": 515.0,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9579908,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 9,
+ "label": "text",
+ "bbox": {
+ "l": 268.0,
+ "t": 442.3333333333333,
+ "r": 284.0,
+ "b": 545.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 93.0,
+ "cells": [
{
"index": 8,
"rgba": {
@@ -3264,36 +4457,36 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 404.0,
- "r_x1": 237.33333333333331,
- "r_y1": 386.3333333333333,
- "r_x2": 231.0,
- "r_y2": 386.3333333333333,
- "r_x3": 231.0,
- "r_y3": 404.0,
+ "r_x0": 284.0,
+ "r_y0": 545.0,
+ "r_x1": 284.0,
+ "r_y1": 442.3333333333333,
+ "r_x2": 268.0,
+ "r_y2": 442.3333333333333,
+ "r_x3": 268.0,
+ "r_y3": 545.0,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 0.96640068,
+ "confidence": 93.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 2,
+ "id": 10,
"label": "text",
"bbox": {
- "l": 228.66666666666669,
- "t": 279.0,
- "r": 237.33333333333331,
- "b": 326.33333333333337,
+ "l": 299.66666666666663,
+ "t": 468.0,
+ "r": 315.33333333333337,
+ "b": 515.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9143174290657043,
+ "confidence": 96.0,
"cells": [
{
"index": 9,
@@ -3304,22 +4497,37 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 326.33333333333337,
- "r_x1": 237.33333333333331,
- "r_y1": 299.0,
- "r_x2": 231.0,
- "r_y2": 299.0,
- "r_x3": 231.0,
- "r_y3": 326.33333333333337,
+ "r_x0": 315.33333333333337,
+ "r_y0": 515.0,
+ "r_x1": 315.33333333333337,
+ "r_y1": 468.0,
+ "r_x2": 299.66666666666663,
+ "r_y2": 468.0,
+ "r_x3": 299.66666666666663,
+ "r_y3": 515.0,
"coord_origin": "TOPLEFT"
},
- "text": "some",
- "orig": "some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.96376541,
+ "confidence": 96.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 11,
+ "label": "text",
+ "bbox": {
+ "l": 105.66666666666666,
+ "t": 274.0,
+ "r": 121.66666666666666,
+ "b": 385.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 10,
"rgba": {
@@ -3329,36 +4537,36 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 295.33333333333337,
- "r_x1": 237.33333333333331,
- "r_y1": 279.0,
- "r_x2": 228.66666666666669,
- "r_y2": 279.0,
- "r_x3": 228.66666666666669,
- "r_y3": 295.33333333333337,
+ "r_x0": 121.66666666666666,
+ "r_y0": 385.6666666666667,
+ "r_x1": 121.66666666666666,
+ "r_y1": 274.0,
+ "r_x2": 105.66666666666666,
+ "r_y2": 274.0,
+ "r_x3": 105.66666666666666,
+ "r_y3": 385.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "cell",
- "orig": "cell",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.95824509,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 6,
+ "id": 12,
"label": "text",
"bbox": {
- "l": 228.66666666666669,
- "t": 149.0,
- "r": 237.33333333333331,
- "b": 213.66666666666666,
+ "l": 137.0,
+ "t": 292.66666666666663,
+ "r": 153.0,
+ "b": 363.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9003775715827942,
+ "confidence": 94.0,
"cells": [
{
"index": 11,
@@ -3369,22 +4577,37 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 213.66666666666666,
- "r_x1": 237.33333333333331,
- "r_y1": 190.0,
- "r_x2": 228.66666666666669,
- "r_y2": 190.0,
- "r_x3": 228.66666666666669,
- "r_y3": 213.66666666666666,
+ "r_x0": 153.0,
+ "r_y0": 363.0,
+ "r_x1": 153.0,
+ "r_y1": 292.66666666666663,
+ "r_x2": 137.0,
+ "r_y2": 292.66666666666663,
+ "r_x3": 137.0,
+ "r_y3": 363.0,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 0.9643471499999999,
+ "confidence": 94.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 13,
+ "label": "text",
+ "bbox": {
+ "l": 188.33333333333331,
+ "t": 278.0,
+ "r": 204.33333333333334,
+ "b": 384.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 12,
"rgba": {
@@ -3394,36 +4617,36 @@
"a": 255
},
"rect": {
- "r_x0": 237.33333333333331,
- "r_y0": 186.0,
- "r_x1": 237.33333333333331,
- "r_y1": 149.0,
- "r_x2": 229.0,
- "r_y2": 149.0,
- "r_x3": 229.0,
- "r_y3": 186.0,
+ "r_x0": 204.33333333333334,
+ "r_y0": 384.0,
+ "r_x1": 204.33333333333334,
+ "r_y1": 278.0,
+ "r_x2": 188.33333333333331,
+ "r_y2": 278.0,
+ "r_x3": 188.33333333333331,
+ "r_y3": 384.0,
"coord_origin": "TOPLEFT"
},
- "text": "content",
- "orig": "content",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.96289528,
+ "confidence": 95.0,
"from_ocr": true
}
],
"children": []
},
{
- "id": 1,
+ "id": 14,
"label": "text",
"bbox": {
- "l": 275.0,
- "t": 371.6666666666667,
- "r": 283.66666666666663,
- "b": 451.6666666666667,
+ "l": 220.0,
+ "t": 304.33333333333337,
+ "r": 236.0,
+ "b": 351.33333333333337,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.9147250652313232,
+ "confidence": 95.0,
"cells": [
{
"index": 13,
@@ -3434,22 +4657,37 @@
"a": 255
},
"rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 451.6666666666667,
- "r_x1": 283.66666666666663,
- "r_y1": 422.6666666666667,
- "r_x2": 275.0,
- "r_y2": 422.6666666666667,
- "r_x3": 275.0,
- "r_y3": 451.6666666666667,
+ "r_x0": 236.0,
+ "r_y0": 351.33333333333337,
+ "r_x1": 236.0,
+ "r_y1": 304.33333333333337,
+ "r_x2": 220.0,
+ "r_y2": 304.33333333333337,
+ "r_x3": 220.0,
+ "r_y3": 351.33333333333337,
"coord_origin": "TOPLEFT"
},
- "text": "Some",
- "orig": "Some",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.9611363199999999,
+ "confidence": 95.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 15,
+ "label": "text",
+ "bbox": {
+ "l": 268.0,
+ "t": 278.0,
+ "r": 284.0,
+ "b": 383.6666666666667,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 14,
"rgba": {
@@ -3459,22 +4697,37 @@
"a": 255
},
"rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 419.0,
- "r_x1": 283.66666666666663,
- "r_y1": 393.0,
- "r_x2": 275.0,
- "r_y2": 393.0,
- "r_x3": 275.0,
- "r_y3": 419.0,
+ "r_x0": 284.0,
+ "r_y0": 383.6666666666667,
+ "r_x1": 284.0,
+ "r_y1": 278.0,
+ "r_x2": 268.0,
+ "r_y2": 278.0,
+ "r_x3": 268.0,
+ "r_y3": 383.6666666666667,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 0.9588653600000001,
+ "confidence": 95.0,
"from_ocr": true
- },
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 16,
+ "label": "text",
+ "bbox": {
+ "l": 299.66666666666663,
+ "t": 304.33333333333337,
+ "r": 315.33333333333337,
+ "b": 351.33333333333337,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
{
"index": 15,
"rgba": {
@@ -3484,85 +4737,20 @@
"a": 255
},
"rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 389.3333333333333,
- "r_x1": 283.66666666666663,
- "r_y1": 371.6666666666667,
- "r_x2": 277.33333333333337,
- "r_y2": 371.6666666666667,
- "r_x3": 277.33333333333337,
- "r_y3": 389.3333333333333,
+ "r_x0": 315.33333333333337,
+ "r_y0": 351.33333333333337,
+ "r_x1": 315.33333333333337,
+ "r_y1": 304.33333333333337,
+ "r_x2": 299.66666666666663,
+ "r_y2": 304.33333333333337,
+ "r_x3": 299.66666666666663,
+ "r_y3": 351.33333333333337,
"coord_origin": "TOPLEFT"
},
- "text": "row",
- "orig": "row",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 0.95681549,
- "from_ocr": true
- }
- ],
- "children": []
- },
- {
- "id": 3,
- "label": "text",
- "bbox": {
- "l": 275.0,
- "t": 275.66666666666663,
- "r": 283.66666666666663,
- "b": 329.0,
- "coord_origin": "TOPLEFT"
- },
- "confidence": 0.9124712347984314,
- "cells": [
- {
- "index": 16,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 329.0,
- "r_x1": 283.66666666666663,
- "r_y1": 303.0,
- "r_x2": 275.0,
- "r_y2": 303.0,
- "r_x3": 275.0,
- "r_y3": 329.0,
- "coord_origin": "TOPLEFT"
- },
- "text": "other",
- "orig": "other",
- "text_direction": "left_to_right",
- "confidence": 0.9589106,
- "from_ocr": true
- },
- {
- "index": 17,
- "rgba": {
- "r": 0,
- "g": 0,
- "b": 0,
- "a": 255
- },
- "rect": {
- "r_x0": 283.66666666666663,
- "r_y0": 299.66666666666663,
- "r_x1": 283.66666666666663,
- "r_y1": 275.66666666666663,
- "r_x2": 275.0,
- "r_y2": 275.66666666666663,
- "r_x3": 275.0,
- "r_y3": 299.66666666666663,
- "coord_origin": "TOPLEFT"
- },
- "text": "don't",
- "orig": "don't",
- "text_direction": "left_to_right",
- "confidence": 0.96121948,
+ "confidence": 95.0,
"from_ocr": true
}
],
@@ -3570,7 +4758,24 @@
}
]
},
- "text": null
+ "text": null,
+ "otsl_seq": [
+ "ched",
+ "ched",
+ "ched",
+ "nl",
+ "fcel",
+ "fcel",
+ "fcel",
+ "nl",
+ "fcel",
+ "fcel",
+ "fcel",
+ "nl"
+ ],
+ "num_rows": 0,
+ "num_cols": 0,
+ "table_cells": []
}
],
"headers": []
diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test.doctags.txt b/tests/data_scanned/groundtruth/docling_v2/ocr_test.doctags.txt
index 89a0eb20..73f13805 100644
--- a/tests/data_scanned/groundtruth/docling_v2/ocr_test.doctags.txt
+++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test.doctags.txt
@@ -1,2 +1,2 @@
-Column 0Column 1Column 2this is row 0some cellshave contentandand row 1otherhaveand last row 2nothinginside
+Vertically mergedOther merged columnYet another columnvalueSome other valueYet another valuevalueSome other valueYet another value
\ No newline at end of file
diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test.json b/tests/data_scanned/groundtruth/docling_v2/ocr_test.json
index e0be74fe..f0ed675a 100644
--- a/tests/data_scanned/groundtruth/docling_v2/ocr_test.json
+++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test.json
@@ -4,7 +4,7 @@
"name": "ocr_test",
"origin": {
"mimetype": "application/pdf",
- "binary_hash": 3906211175708501508,
+ "binary_hash": 14846044078209721391,
"filename": "ocr_test.pdf"
},
"furniture": {
@@ -41,10 +41,10 @@
{
"page_no": 1,
"bbox": {
- "l": 103.33,
- "t": 519.86,
- "r": 560.95,
- "b": 234.07,
+ "l": 69.05,
+ "t": 524.35,
+ "r": 551.1,
+ "b": 277.42,
"coord_origin": "BOTTOMLEFT"
},
"charspan": [
@@ -60,67 +60,29 @@
"table_cells": [
{
"bbox": {
- "l": 245.02,
- "t": 106.57,
- "r": 307.59,
- "b": 120.29,
+ "l": 97.33,
+ "t": 105.67,
+ "r": 190.0,
+ "b": 126.33,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
"col_span": 1,
"start_row_offset_idx": 0,
"end_row_offset_idx": 1,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "Column 0",
+ "start_col_offset_idx": 0,
+ "end_col_offset_idx": 1,
+ "text": "Vertically merged",
"column_header": true,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 358.65,
- "t": 106.57,
- "r": 421.22,
- "b": 120.29,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "Column 1",
- "column_header": true,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 472.27,
- "t": 106.57,
- "r": 534.84,
- "b": 120.29,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "Column 2",
- "column_header": true,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 123.52,
- "t": 174.07,
- "r": 200.67,
- "b": 187.79,
+ "l": 121.67,
+ "t": 204.33,
+ "r": 168.67,
+ "b": 220.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -129,74 +91,17 @@
"end_row_offset_idx": 2,
"start_col_offset_idx": 0,
"end_col_offset_idx": 1,
- "text": "this is row 0",
- "column_header": false,
- "row_header": true,
- "row_section": false
- },
- {
- "bbox": {
- "l": 241.65,
- "t": 174.07,
- "r": 310.71,
- "b": 187.79,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "some cells",
+ "text": "value",
"column_header": false,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 347.4,
- "t": 174.07,
- "r": 431.1,
- "b": 187.79,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "have content",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 491.4,
- "t": 174.07,
- "r": 515.79,
- "b": 187.79,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "and",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 130.27,
- "t": 242.7,
- "r": 194.46,
- "b": 256.41,
+ "l": 121.67,
+ "t": 284.0,
+ "r": 168.67,
+ "b": 300.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -205,17 +110,112 @@
"end_row_offset_idx": 3,
"start_col_offset_idx": 0,
"end_col_offset_idx": 1,
- "text": "and row 1",
+ "text": "value",
"column_header": false,
- "row_header": true,
+ "row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 373.27,
- "t": 242.7,
- "r": 406.59,
- "b": 256.41,
+ "l": 232.67,
+ "t": 105.67,
+ "r": 364.0,
+ "b": 126.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Other merged column",
+ "column_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 247.0,
+ "t": 188.33,
+ "r": 349.67,
+ "b": 204.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Some other value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 247.0,
+ "t": 268.0,
+ "r": 349.67,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 2,
+ "end_row_offset_idx": 3,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Some other value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 406.33,
+ "t": 105.67,
+ "r": 518.33,
+ "b": 121.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another column",
+ "column_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 408.33,
+ "t": 188.33,
+ "r": 514.0,
+ "b": 204.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 408.33,
+ "t": 268.0,
+ "r": 514.0,
+ "b": 284.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -224,110 +224,41 @@
"end_row_offset_idx": 3,
"start_col_offset_idx": 2,
"end_col_offset_idx": 3,
- "text": "other",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 486.9,
- "t": 242.7,
- "r": 518.61,
- "b": 256.41,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "have",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 116.77,
- "t": 315.82,
- "r": 207.76,
- "b": 329.54,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "and last row 2",
- "column_header": false,
- "row_header": true,
- "row_section": false
- },
- {
- "bbox": {
- "l": 251.77,
- "t": 315.82,
- "r": 299.73,
- "b": 329.54,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "nothing",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 484.65,
- "t": 315.82,
- "r": 522.85,
- "b": 329.54,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "inside",
+ "text": "Yet another value",
"column_header": false,
"row_header": false,
"row_section": false
}
],
- "num_rows": 4,
- "num_cols": 4,
+ "num_rows": 3,
+ "num_cols": 3,
"grid": [
[
{
+ "bbox": {
+ "l": 97.33,
+ "t": 105.67,
+ "r": 190.0,
+ "b": 126.33,
+ "coord_origin": "TOPLEFT"
+ },
"row_span": 1,
"col_span": 1,
"start_row_offset_idx": 0,
"end_row_offset_idx": 1,
"start_col_offset_idx": 0,
"end_col_offset_idx": 1,
- "text": "",
- "column_header": false,
+ "text": "Vertically merged",
+ "column_header": true,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 245.02,
- "t": 106.57,
- "r": 307.59,
- "b": 120.29,
+ "l": 232.67,
+ "t": 105.67,
+ "r": 364.0,
+ "b": 126.33,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -336,17 +267,17 @@
"end_row_offset_idx": 1,
"start_col_offset_idx": 1,
"end_col_offset_idx": 2,
- "text": "Column 0",
+ "text": "Other merged column",
"column_header": true,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 358.65,
- "t": 106.57,
- "r": 421.22,
- "b": 120.29,
+ "l": 406.33,
+ "t": 105.67,
+ "r": 518.33,
+ "b": 121.67,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -355,26 +286,7 @@
"end_row_offset_idx": 1,
"start_col_offset_idx": 2,
"end_col_offset_idx": 3,
- "text": "Column 1",
- "column_header": true,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 472.27,
- "t": 106.57,
- "r": 534.84,
- "b": 120.29,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "Column 2",
+ "text": "Yet another column",
"column_header": true,
"row_header": false,
"row_section": false
@@ -383,10 +295,10 @@
[
{
"bbox": {
- "l": 123.52,
- "t": 174.07,
- "r": 200.67,
- "b": 187.79,
+ "l": 121.67,
+ "t": 204.33,
+ "r": 168.67,
+ "b": 220.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -395,17 +307,17 @@
"end_row_offset_idx": 2,
"start_col_offset_idx": 0,
"end_col_offset_idx": 1,
- "text": "this is row 0",
+ "text": "value",
"column_header": false,
- "row_header": true,
+ "row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 241.65,
- "t": 174.07,
- "r": 310.71,
- "b": 187.79,
+ "l": 247.0,
+ "t": 188.33,
+ "r": 349.67,
+ "b": 204.33,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -414,17 +326,17 @@
"end_row_offset_idx": 2,
"start_col_offset_idx": 1,
"end_col_offset_idx": 2,
- "text": "some cells",
+ "text": "Some other value",
"column_header": false,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 347.4,
- "t": 174.07,
- "r": 431.1,
- "b": 187.79,
+ "l": 408.33,
+ "t": 188.33,
+ "r": 514.0,
+ "b": 204.33,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -433,26 +345,7 @@
"end_row_offset_idx": 2,
"start_col_offset_idx": 2,
"end_col_offset_idx": 3,
- "text": "have content",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 491.4,
- "t": 174.07,
- "r": 515.79,
- "b": 187.79,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "and",
+ "text": "Yet another value",
"column_header": false,
"row_header": false,
"row_section": false
@@ -461,10 +354,10 @@
[
{
"bbox": {
- "l": 130.27,
- "t": 242.7,
- "r": 194.46,
- "b": 256.41,
+ "l": 121.67,
+ "t": 284.0,
+ "r": 168.67,
+ "b": 300.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -473,29 +366,36 @@
"end_row_offset_idx": 3,
"start_col_offset_idx": 0,
"end_col_offset_idx": 1,
- "text": "and row 1",
- "column_header": false,
- "row_header": true,
- "row_section": false
- },
- {
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "",
+ "text": "value",
"column_header": false,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 373.27,
- "t": 242.7,
- "r": 406.59,
- "b": 256.41,
+ "l": 247.0,
+ "t": 268.0,
+ "r": 349.67,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 2,
+ "end_row_offset_idx": 3,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Some other value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 408.33,
+ "t": 268.0,
+ "r": 514.0,
+ "b": 284.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -504,97 +404,7 @@
"end_row_offset_idx": 3,
"start_col_offset_idx": 2,
"end_col_offset_idx": 3,
- "text": "other",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 486.9,
- "t": 242.7,
- "r": 518.61,
- "b": 256.41,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "have",
- "column_header": false,
- "row_header": false,
- "row_section": false
- }
- ],
- [
- {
- "bbox": {
- "l": 116.77,
- "t": 315.82,
- "r": 207.76,
- "b": 329.54,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "and last row 2",
- "column_header": false,
- "row_header": true,
- "row_section": false
- },
- {
- "bbox": {
- "l": 251.77,
- "t": 315.82,
- "r": 299.73,
- "b": 329.54,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "nothing",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 484.65,
- "t": 315.82,
- "r": 522.85,
- "b": 329.54,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "inside",
+ "text": "Yet another value",
"column_header": false,
"row_header": false,
"row_section": false
@@ -610,8 +420,8 @@
"pages": {
"1": {
"size": {
- "width": 842.0,
- "height": 595.0
+ "width": 792.0,
+ "height": 612.0
},
"page_no": 1
}
diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test.md b/tests/data_scanned/groundtruth/docling_v2/ocr_test.md
index c466de2b..e3d7c0b8 100644
--- a/tests/data_scanned/groundtruth/docling_v2/ocr_test.md
+++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test.md
@@ -1,5 +1,4 @@
-| | Column 0 | Column 1 | Column 2 |
-|----------------|------------|--------------|------------|
-| this is row 0 | some cells | have content | and |
-| and row 1 | | other | have |
-| and last row 2 | nothing | | inside |
\ No newline at end of file
+| Vertically merged | Other merged column | Yet another column |
+|---------------------|-----------------------|----------------------|
+| value | Some other value | Yet another value |
+| value | Some other value | Yet another value |
\ No newline at end of file
diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test.pages.json b/tests/data_scanned/groundtruth/docling_v2/ocr_test.pages.json
index e3613adc..4470bece 100644
--- a/tests/data_scanned/groundtruth/docling_v2/ocr_test.pages.json
+++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test.pages.json
@@ -2,8 +2,8 @@
{
"page_no": 0,
"size": {
- "width": 842.0,
- "height": 595.0
+ "width": 792.0,
+ "height": 612.0
},
"parsed_page": {
"dimension": {
@@ -11,47 +11,47 @@
"rect": {
"r_x0": 0.0,
"r_y0": 0.0,
- "r_x1": 842.0,
+ "r_x1": 792.0,
"r_y1": 0.0,
- "r_x2": 842.0,
- "r_y2": 595.0,
+ "r_x2": 792.0,
+ "r_y2": 612.0,
"r_x3": 0.0,
- "r_y3": 595.0,
+ "r_y3": 612.0,
"coord_origin": "BOTTOMLEFT"
},
"boundary_type": "crop_box",
"art_bbox": {
"l": 0.0,
- "t": 595.0,
- "r": 842.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
},
"bleed_bbox": {
"l": 0.0,
- "t": 595.0,
- "r": 842.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
},
"crop_bbox": {
"l": 0.0,
- "t": 595.0,
- "r": 842.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
},
"media_bbox": {
"l": 0.0,
- "t": 595.0,
- "r": 842.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
},
"trim_bbox": {
"l": 0.0,
- "t": 595.0,
- "r": 842.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
}
@@ -69,21 +69,21 @@
"a": 255
},
"rect": {
- "r_x0": 245.02,
- "r_y0": 120.29,
- "r_x1": 307.59,
- "r_y1": 120.29,
- "r_x2": 307.59,
- "r_y2": 106.57,
- "r_x3": 245.02,
- "r_y3": 106.57,
+ "r_x0": 97.33,
+ "r_y0": 126.33,
+ "r_x1": 190.0,
+ "r_y1": 126.33,
+ "r_x2": 190.0,
+ "r_y2": 105.67,
+ "r_x3": 97.33,
+ "r_y3": 105.67,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 89.0,
+ "from_ocr": true
},
{
"index": 1,
@@ -94,21 +94,21 @@
"a": 255
},
"rect": {
- "r_x0": 358.65,
- "r_y0": 120.29,
- "r_x1": 421.22,
- "r_y1": 120.29,
- "r_x2": 421.22,
- "r_y2": 106.57,
- "r_x3": 358.65,
- "r_y3": 106.57,
+ "r_x0": 112.0,
+ "r_y0": 157.67,
+ "r_x1": 182.33,
+ "r_y1": 157.67,
+ "r_x2": 182.33,
+ "r_y2": 137.0,
+ "r_x3": 112.0,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 2,
@@ -119,21 +119,21 @@
"a": 255
},
"rect": {
- "r_x0": 472.27,
- "r_y0": 120.29,
- "r_x1": 534.84,
- "r_y1": 120.29,
- "r_x2": 534.84,
- "r_y2": 106.57,
- "r_x3": 472.27,
- "r_y3": 106.57,
+ "r_x0": 121.67,
+ "r_y0": 220.0,
+ "r_x1": 168.67,
+ "r_y1": 220.0,
+ "r_x2": 168.67,
+ "r_y2": 204.33,
+ "r_x3": 121.67,
+ "r_y3": 204.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 3,
@@ -144,21 +144,21 @@
"a": 255
},
"rect": {
- "r_x0": 123.52,
- "r_y0": 187.79,
- "r_x1": 200.67,
- "r_y1": 187.79,
- "r_x2": 200.67,
- "r_y2": 174.07,
- "r_x3": 123.52,
- "r_y3": 174.07,
+ "r_x0": 121.67,
+ "r_y0": 300.0,
+ "r_x1": 168.67,
+ "r_y1": 300.0,
+ "r_x2": 168.67,
+ "r_y2": 284.0,
+ "r_x3": 121.67,
+ "r_y3": 284.0,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 4,
@@ -169,21 +169,21 @@
"a": 255
},
"rect": {
- "r_x0": 241.65,
- "r_y0": 187.79,
- "r_x1": 310.71,
- "r_y1": 187.79,
- "r_x2": 310.71,
- "r_y2": 174.07,
- "r_x3": 241.65,
- "r_y3": 174.07,
+ "r_x0": 232.67,
+ "r_y0": 126.33,
+ "r_x1": 364.0,
+ "r_y1": 126.33,
+ "r_x2": 364.0,
+ "r_y2": 105.67,
+ "r_x3": 232.67,
+ "r_y3": 105.67,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 5,
@@ -194,21 +194,21 @@
"a": 255
},
"rect": {
- "r_x0": 347.4,
- "r_y0": 187.79,
- "r_x1": 431.1,
- "r_y1": 187.79,
- "r_x2": 431.1,
- "r_y2": 174.07,
- "r_x3": 347.4,
- "r_y3": 174.07,
+ "r_x0": 265.67,
+ "r_y0": 153.0,
+ "r_x1": 336.0,
+ "r_y1": 153.0,
+ "r_x2": 336.0,
+ "r_y2": 137.0,
+ "r_x3": 265.67,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 6,
@@ -219,21 +219,21 @@
"a": 255
},
"rect": {
- "r_x0": 491.4,
- "r_y0": 187.79,
- "r_x1": 515.79,
- "r_y1": 187.79,
- "r_x2": 515.79,
- "r_y2": 174.07,
- "r_x3": 491.4,
- "r_y3": 174.07,
+ "r_x0": 247.0,
+ "r_y0": 204.33,
+ "r_x1": 349.67,
+ "r_y1": 204.33,
+ "r_x2": 349.67,
+ "r_y2": 188.33,
+ "r_x3": 247.0,
+ "r_y3": 188.33,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 7,
@@ -244,21 +244,21 @@
"a": 255
},
"rect": {
- "r_x0": 130.27,
- "r_y0": 256.41,
- "r_x1": 194.46,
- "r_y1": 256.41,
- "r_x2": 194.46,
- "r_y2": 242.7,
- "r_x3": 130.27,
- "r_y3": 242.7,
+ "r_x0": 277.0,
+ "r_y0": 236.0,
+ "r_x1": 324.33,
+ "r_y1": 236.0,
+ "r_x2": 324.33,
+ "r_y2": 220.0,
+ "r_x3": 277.0,
+ "r_y3": 220.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 8,
@@ -269,21 +269,21 @@
"a": 255
},
"rect": {
- "r_x0": 373.27,
- "r_y0": 256.41,
- "r_x1": 406.59,
- "r_y1": 256.41,
- "r_x2": 406.59,
- "r_y2": 242.7,
- "r_x3": 373.27,
- "r_y3": 242.7,
+ "r_x0": 247.0,
+ "r_y0": 284.0,
+ "r_x1": 349.67,
+ "r_y1": 284.0,
+ "r_x2": 349.67,
+ "r_y2": 268.0,
+ "r_x3": 247.0,
+ "r_y3": 268.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 9,
@@ -294,21 +294,21 @@
"a": 255
},
"rect": {
- "r_x0": 486.9,
- "r_y0": 256.41,
- "r_x1": 518.61,
- "r_y1": 256.41,
- "r_x2": 518.61,
- "r_y2": 242.7,
- "r_x3": 486.9,
- "r_y3": 242.7,
+ "r_x0": 277.0,
+ "r_y0": 315.33,
+ "r_x1": 324.33,
+ "r_y1": 315.33,
+ "r_x2": 324.33,
+ "r_y2": 299.67,
+ "r_x3": 277.0,
+ "r_y3": 299.67,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 10,
@@ -319,21 +319,21 @@
"a": 255
},
"rect": {
- "r_x0": 116.77,
- "r_y0": 329.54,
- "r_x1": 207.76,
- "r_y1": 329.54,
- "r_x2": 207.76,
- "r_y2": 315.82,
- "r_x3": 116.77,
- "r_y3": 315.82,
+ "r_x0": 406.33,
+ "r_y0": 121.67,
+ "r_x1": 518.33,
+ "r_y1": 121.67,
+ "r_x2": 518.33,
+ "r_y2": 105.67,
+ "r_x3": 406.33,
+ "r_y3": 105.67,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 11,
@@ -344,21 +344,21 @@
"a": 255
},
"rect": {
- "r_x0": 251.77,
- "r_y0": 329.54,
- "r_x1": 299.73,
- "r_y1": 329.54,
- "r_x2": 299.73,
- "r_y2": 315.82,
- "r_x3": 251.77,
- "r_y3": 315.82,
+ "r_x0": 429.33,
+ "r_y0": 153.0,
+ "r_x1": 499.33,
+ "r_y1": 153.0,
+ "r_x2": 499.33,
+ "r_y2": 137.0,
+ "r_x3": 429.33,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 12,
@@ -369,21 +369,96 @@
"a": 255
},
"rect": {
- "r_x0": 484.65,
- "r_y0": 329.54,
- "r_x1": 522.85,
- "r_y1": 329.54,
- "r_x2": 522.85,
- "r_y2": 315.82,
- "r_x3": 484.65,
- "r_y3": 315.82,
+ "r_x0": 408.33,
+ "r_y0": 204.33,
+ "r_x1": 514.0,
+ "r_y1": 204.33,
+ "r_x2": 514.0,
+ "r_y2": 188.33,
+ "r_x3": 408.33,
+ "r_y3": 188.33,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 440.67,
+ "r_y0": 236.0,
+ "r_x1": 487.67,
+ "r_y1": 236.0,
+ "r_x2": 487.67,
+ "r_y2": 220.0,
+ "r_x3": 440.67,
+ "r_y3": 220.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 408.33,
+ "r_y0": 284.0,
+ "r_x1": 514.0,
+ "r_y1": 284.0,
+ "r_x2": 514.0,
+ "r_y2": 268.0,
+ "r_x3": 408.33,
+ "r_y3": 268.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 440.67,
+ "r_y0": 315.33,
+ "r_x1": 487.67,
+ "r_y1": 315.33,
+ "r_x2": 487.67,
+ "r_y2": 299.67,
+ "r_x3": 440.67,
+ "r_y3": 299.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"has_chars": false,
@@ -399,13 +474,13 @@
"id": 0,
"label": "table",
"bbox": {
- "l": 103.33,
- "t": 75.14,
- "r": 560.95,
- "b": 360.93,
+ "l": 69.05,
+ "t": 87.65,
+ "r": 551.1,
+ "b": 334.58,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.968,
+ "confidence": 0.979,
"cells": [
{
"index": 0,
@@ -416,21 +491,21 @@
"a": 255
},
"rect": {
- "r_x0": 245.02,
- "r_y0": 120.29,
- "r_x1": 307.59,
- "r_y1": 120.29,
- "r_x2": 307.59,
- "r_y2": 106.57,
- "r_x3": 245.02,
- "r_y3": 106.57,
+ "r_x0": 97.33,
+ "r_y0": 126.33,
+ "r_x1": 190.0,
+ "r_y1": 126.33,
+ "r_x2": 190.0,
+ "r_y2": 105.67,
+ "r_x3": 97.33,
+ "r_y3": 105.67,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 89.0,
+ "from_ocr": true
},
{
"index": 1,
@@ -441,21 +516,21 @@
"a": 255
},
"rect": {
- "r_x0": 358.65,
- "r_y0": 120.29,
- "r_x1": 421.22,
- "r_y1": 120.29,
- "r_x2": 421.22,
- "r_y2": 106.57,
- "r_x3": 358.65,
- "r_y3": 106.57,
+ "r_x0": 112.0,
+ "r_y0": 157.67,
+ "r_x1": 182.33,
+ "r_y1": 157.67,
+ "r_x2": 182.33,
+ "r_y2": 137.0,
+ "r_x3": 112.0,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 2,
@@ -466,21 +541,21 @@
"a": 255
},
"rect": {
- "r_x0": 472.27,
- "r_y0": 120.29,
- "r_x1": 534.84,
- "r_y1": 120.29,
- "r_x2": 534.84,
- "r_y2": 106.57,
- "r_x3": 472.27,
- "r_y3": 106.57,
+ "r_x0": 121.67,
+ "r_y0": 220.0,
+ "r_x1": 168.67,
+ "r_y1": 220.0,
+ "r_x2": 168.67,
+ "r_y2": 204.33,
+ "r_x3": 121.67,
+ "r_y3": 204.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 3,
@@ -491,21 +566,21 @@
"a": 255
},
"rect": {
- "r_x0": 123.52,
- "r_y0": 187.79,
- "r_x1": 200.67,
- "r_y1": 187.79,
- "r_x2": 200.67,
- "r_y2": 174.07,
- "r_x3": 123.52,
- "r_y3": 174.07,
+ "r_x0": 121.67,
+ "r_y0": 300.0,
+ "r_x1": 168.67,
+ "r_y1": 300.0,
+ "r_x2": 168.67,
+ "r_y2": 284.0,
+ "r_x3": 121.67,
+ "r_y3": 284.0,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 4,
@@ -516,21 +591,21 @@
"a": 255
},
"rect": {
- "r_x0": 241.65,
- "r_y0": 187.79,
- "r_x1": 310.71,
- "r_y1": 187.79,
- "r_x2": 310.71,
- "r_y2": 174.07,
- "r_x3": 241.65,
- "r_y3": 174.07,
+ "r_x0": 232.67,
+ "r_y0": 126.33,
+ "r_x1": 364.0,
+ "r_y1": 126.33,
+ "r_x2": 364.0,
+ "r_y2": 105.67,
+ "r_x3": 232.67,
+ "r_y3": 105.67,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 5,
@@ -541,21 +616,21 @@
"a": 255
},
"rect": {
- "r_x0": 347.4,
- "r_y0": 187.79,
- "r_x1": 431.1,
- "r_y1": 187.79,
- "r_x2": 431.1,
- "r_y2": 174.07,
- "r_x3": 347.4,
- "r_y3": 174.07,
+ "r_x0": 265.67,
+ "r_y0": 153.0,
+ "r_x1": 336.0,
+ "r_y1": 153.0,
+ "r_x2": 336.0,
+ "r_y2": 137.0,
+ "r_x3": 265.67,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 6,
@@ -566,21 +641,21 @@
"a": 255
},
"rect": {
- "r_x0": 491.4,
- "r_y0": 187.79,
- "r_x1": 515.79,
- "r_y1": 187.79,
- "r_x2": 515.79,
- "r_y2": 174.07,
- "r_x3": 491.4,
- "r_y3": 174.07,
+ "r_x0": 247.0,
+ "r_y0": 204.33,
+ "r_x1": 349.67,
+ "r_y1": 204.33,
+ "r_x2": 349.67,
+ "r_y2": 188.33,
+ "r_x3": 247.0,
+ "r_y3": 188.33,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 7,
@@ -591,21 +666,21 @@
"a": 255
},
"rect": {
- "r_x0": 130.27,
- "r_y0": 256.41,
- "r_x1": 194.46,
- "r_y1": 256.41,
- "r_x2": 194.46,
- "r_y2": 242.7,
- "r_x3": 130.27,
- "r_y3": 242.7,
+ "r_x0": 277.0,
+ "r_y0": 236.0,
+ "r_x1": 324.33,
+ "r_y1": 236.0,
+ "r_x2": 324.33,
+ "r_y2": 220.0,
+ "r_x3": 277.0,
+ "r_y3": 220.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 8,
@@ -616,21 +691,21 @@
"a": 255
},
"rect": {
- "r_x0": 373.27,
- "r_y0": 256.41,
- "r_x1": 406.59,
- "r_y1": 256.41,
- "r_x2": 406.59,
- "r_y2": 242.7,
- "r_x3": 373.27,
- "r_y3": 242.7,
+ "r_x0": 247.0,
+ "r_y0": 284.0,
+ "r_x1": 349.67,
+ "r_y1": 284.0,
+ "r_x2": 349.67,
+ "r_y2": 268.0,
+ "r_x3": 247.0,
+ "r_y3": 268.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 9,
@@ -641,21 +716,21 @@
"a": 255
},
"rect": {
- "r_x0": 486.9,
- "r_y0": 256.41,
- "r_x1": 518.61,
- "r_y1": 256.41,
- "r_x2": 518.61,
- "r_y2": 242.7,
- "r_x3": 486.9,
- "r_y3": 242.7,
+ "r_x0": 277.0,
+ "r_y0": 315.33,
+ "r_x1": 324.33,
+ "r_y1": 315.33,
+ "r_x2": 324.33,
+ "r_y2": 299.67,
+ "r_x3": 277.0,
+ "r_y3": 299.67,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 10,
@@ -666,21 +741,21 @@
"a": 255
},
"rect": {
- "r_x0": 116.77,
- "r_y0": 329.54,
- "r_x1": 207.76,
- "r_y1": 329.54,
- "r_x2": 207.76,
- "r_y2": 315.82,
- "r_x3": 116.77,
- "r_y3": 315.82,
+ "r_x0": 406.33,
+ "r_y0": 121.67,
+ "r_x1": 518.33,
+ "r_y1": 121.67,
+ "r_x2": 518.33,
+ "r_y2": 105.67,
+ "r_x3": 406.33,
+ "r_y3": 105.67,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 11,
@@ -691,21 +766,21 @@
"a": 255
},
"rect": {
- "r_x0": 251.77,
- "r_y0": 329.54,
- "r_x1": 299.73,
- "r_y1": 329.54,
- "r_x2": 299.73,
- "r_y2": 315.82,
- "r_x3": 251.77,
- "r_y3": 315.82,
+ "r_x0": 429.33,
+ "r_y0": 153.0,
+ "r_x1": 499.33,
+ "r_y1": 153.0,
+ "r_x2": 499.33,
+ "r_y2": 137.0,
+ "r_x3": 429.33,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 12,
@@ -716,35 +791,110 @@
"a": 255
},
"rect": {
- "r_x0": 484.65,
- "r_y0": 329.54,
- "r_x1": 522.85,
- "r_y1": 329.54,
- "r_x2": 522.85,
- "r_y2": 315.82,
- "r_x3": 484.65,
- "r_y3": 315.82,
+ "r_x0": 408.33,
+ "r_y0": 204.33,
+ "r_x1": 514.0,
+ "r_y1": 204.33,
+ "r_x2": 514.0,
+ "r_y2": 188.33,
+ "r_x3": 408.33,
+ "r_y3": 188.33,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 440.67,
+ "r_y0": 236.0,
+ "r_x1": 487.67,
+ "r_y1": 236.0,
+ "r_x2": 487.67,
+ "r_y2": 220.0,
+ "r_x3": 440.67,
+ "r_y3": 220.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 408.33,
+ "r_y0": 284.0,
+ "r_x1": 514.0,
+ "r_y1": 284.0,
+ "r_x2": 514.0,
+ "r_y2": 268.0,
+ "r_x3": 408.33,
+ "r_y3": 268.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 440.67,
+ "r_y0": 315.33,
+ "r_x1": 487.67,
+ "r_y1": 315.33,
+ "r_x2": 487.67,
+ "r_y2": 299.67,
+ "r_x3": 440.67,
+ "r_y3": 299.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": [
{
- "id": 14,
+ "id": 1,
"label": "text",
"bbox": {
- "l": 245.02,
- "t": 106.57,
- "r": 307.59,
- "b": 120.29,
+ "l": 97.33,
+ "t": 105.67,
+ "r": 190.0,
+ "b": 126.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 89.0,
"cells": [
{
"index": 0,
@@ -755,36 +905,36 @@
"a": 255
},
"rect": {
- "r_x0": 245.02,
- "r_y0": 120.29,
- "r_x1": 307.59,
- "r_y1": 120.29,
- "r_x2": 307.59,
- "r_y2": 106.57,
- "r_x3": 245.02,
- "r_y3": 106.57,
+ "r_x0": 97.33,
+ "r_y0": 126.33,
+ "r_x1": 190.0,
+ "r_y1": 126.33,
+ "r_x2": 190.0,
+ "r_y2": 105.67,
+ "r_x3": 97.33,
+ "r_y3": 105.67,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 89.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 15,
+ "id": 2,
"label": "text",
"bbox": {
- "l": 358.65,
- "t": 106.57,
- "r": 421.22,
- "b": 120.29,
+ "l": 112.0,
+ "t": 137.0,
+ "r": 182.33,
+ "b": 157.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 92.0,
"cells": [
{
"index": 1,
@@ -795,36 +945,36 @@
"a": 255
},
"rect": {
- "r_x0": 358.65,
- "r_y0": 120.29,
- "r_x1": 421.22,
- "r_y1": 120.29,
- "r_x2": 421.22,
- "r_y2": 106.57,
- "r_x3": 358.65,
- "r_y3": 106.57,
+ "r_x0": 112.0,
+ "r_y0": 157.67,
+ "r_x1": 182.33,
+ "r_y1": 157.67,
+ "r_x2": 182.33,
+ "r_y2": 137.0,
+ "r_x3": 112.0,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 16,
+ "id": 3,
"label": "text",
"bbox": {
- "l": 472.27,
- "t": 106.57,
- "r": 534.84,
- "b": 120.29,
+ "l": 121.67,
+ "t": 204.33,
+ "r": 168.67,
+ "b": 220.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 2,
@@ -835,36 +985,36 @@
"a": 255
},
"rect": {
- "r_x0": 472.27,
- "r_y0": 120.29,
- "r_x1": 534.84,
- "r_y1": 120.29,
- "r_x2": 534.84,
- "r_y2": 106.57,
- "r_x3": 472.27,
- "r_y3": 106.57,
+ "r_x0": 121.67,
+ "r_y0": 220.0,
+ "r_x1": 168.67,
+ "r_y1": 220.0,
+ "r_x2": 168.67,
+ "r_y2": 204.33,
+ "r_x3": 121.67,
+ "r_y3": 204.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 17,
+ "id": 4,
"label": "text",
"bbox": {
- "l": 123.52,
- "t": 174.07,
- "r": 200.67,
- "b": 187.79,
+ "l": 121.67,
+ "t": 284.0,
+ "r": 168.67,
+ "b": 300.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 3,
@@ -875,36 +1025,36 @@
"a": 255
},
"rect": {
- "r_x0": 123.52,
- "r_y0": 187.79,
- "r_x1": 200.67,
- "r_y1": 187.79,
- "r_x2": 200.67,
- "r_y2": 174.07,
- "r_x3": 123.52,
- "r_y3": 174.07,
+ "r_x0": 121.67,
+ "r_y0": 300.0,
+ "r_x1": 168.67,
+ "r_y1": 300.0,
+ "r_x2": 168.67,
+ "r_y2": 284.0,
+ "r_x3": 121.67,
+ "r_y3": 284.0,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 18,
+ "id": 5,
"label": "text",
"bbox": {
- "l": 241.65,
- "t": 174.07,
- "r": 310.71,
- "b": 187.79,
+ "l": 232.67,
+ "t": 105.67,
+ "r": 364.0,
+ "b": 126.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 92.0,
"cells": [
{
"index": 4,
@@ -915,36 +1065,36 @@
"a": 255
},
"rect": {
- "r_x0": 241.65,
- "r_y0": 187.79,
- "r_x1": 310.71,
- "r_y1": 187.79,
- "r_x2": 310.71,
- "r_y2": 174.07,
- "r_x3": 241.65,
- "r_y3": 174.07,
+ "r_x0": 232.67,
+ "r_y0": 126.33,
+ "r_x1": 364.0,
+ "r_y1": 126.33,
+ "r_x2": 364.0,
+ "r_y2": 105.67,
+ "r_x3": 232.67,
+ "r_y3": 105.67,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 19,
+ "id": 6,
"label": "text",
"bbox": {
- "l": 347.4,
- "t": 174.07,
- "r": 431.1,
- "b": 187.79,
+ "l": 265.67,
+ "t": 137.0,
+ "r": 336.0,
+ "b": 153.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 5,
@@ -955,36 +1105,36 @@
"a": 255
},
"rect": {
- "r_x0": 347.4,
- "r_y0": 187.79,
- "r_x1": 431.1,
- "r_y1": 187.79,
- "r_x2": 431.1,
- "r_y2": 174.07,
- "r_x3": 347.4,
- "r_y3": 174.07,
+ "r_x0": 265.67,
+ "r_y0": 153.0,
+ "r_x1": 336.0,
+ "r_y1": 153.0,
+ "r_x2": 336.0,
+ "r_y2": 137.0,
+ "r_x3": 265.67,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 20,
+ "id": 7,
"label": "text",
"bbox": {
- "l": 491.4,
- "t": 174.07,
- "r": 515.79,
- "b": 187.79,
+ "l": 247.0,
+ "t": 188.33,
+ "r": 349.67,
+ "b": 204.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 6,
@@ -995,36 +1145,36 @@
"a": 255
},
"rect": {
- "r_x0": 491.4,
- "r_y0": 187.79,
- "r_x1": 515.79,
- "r_y1": 187.79,
- "r_x2": 515.79,
- "r_y2": 174.07,
- "r_x3": 491.4,
- "r_y3": 174.07,
+ "r_x0": 247.0,
+ "r_y0": 204.33,
+ "r_x1": 349.67,
+ "r_y1": 204.33,
+ "r_x2": 349.67,
+ "r_y2": 188.33,
+ "r_x3": 247.0,
+ "r_y3": 188.33,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 21,
+ "id": 8,
"label": "text",
"bbox": {
- "l": 130.27,
- "t": 242.7,
- "r": 194.46,
- "b": 256.41,
+ "l": 277.0,
+ "t": 220.0,
+ "r": 324.33,
+ "b": 236.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 7,
@@ -1035,36 +1185,36 @@
"a": 255
},
"rect": {
- "r_x0": 130.27,
- "r_y0": 256.41,
- "r_x1": 194.46,
- "r_y1": 256.41,
- "r_x2": 194.46,
- "r_y2": 242.7,
- "r_x3": 130.27,
- "r_y3": 242.7,
+ "r_x0": 277.0,
+ "r_y0": 236.0,
+ "r_x1": 324.33,
+ "r_y1": 236.0,
+ "r_x2": 324.33,
+ "r_y2": 220.0,
+ "r_x3": 277.0,
+ "r_y3": 220.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 22,
+ "id": 9,
"label": "text",
"bbox": {
- "l": 373.27,
- "t": 242.7,
- "r": 406.59,
- "b": 256.41,
+ "l": 247.0,
+ "t": 268.0,
+ "r": 349.67,
+ "b": 284.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 92.0,
"cells": [
{
"index": 8,
@@ -1075,36 +1225,36 @@
"a": 255
},
"rect": {
- "r_x0": 373.27,
- "r_y0": 256.41,
- "r_x1": 406.59,
- "r_y1": 256.41,
- "r_x2": 406.59,
- "r_y2": 242.7,
- "r_x3": 373.27,
- "r_y3": 242.7,
+ "r_x0": 247.0,
+ "r_y0": 284.0,
+ "r_x1": 349.67,
+ "r_y1": 284.0,
+ "r_x2": 349.67,
+ "r_y2": 268.0,
+ "r_x3": 247.0,
+ "r_y3": 268.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 23,
+ "id": 10,
"label": "text",
"bbox": {
- "l": 486.9,
- "t": 242.7,
- "r": 518.61,
- "b": 256.41,
+ "l": 277.0,
+ "t": 299.67,
+ "r": 324.33,
+ "b": 315.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 9,
@@ -1115,36 +1265,36 @@
"a": 255
},
"rect": {
- "r_x0": 486.9,
- "r_y0": 256.41,
- "r_x1": 518.61,
- "r_y1": 256.41,
- "r_x2": 518.61,
- "r_y2": 242.7,
- "r_x3": 486.9,
- "r_y3": 242.7,
+ "r_x0": 277.0,
+ "r_y0": 315.33,
+ "r_x1": 324.33,
+ "r_y1": 315.33,
+ "r_x2": 324.33,
+ "r_y2": 299.67,
+ "r_x3": 277.0,
+ "r_y3": 299.67,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 24,
+ "id": 11,
"label": "text",
"bbox": {
- "l": 116.77,
- "t": 315.82,
- "r": 207.76,
- "b": 329.54,
+ "l": 406.33,
+ "t": 105.67,
+ "r": 518.33,
+ "b": 121.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 10,
@@ -1155,36 +1305,36 @@
"a": 255
},
"rect": {
- "r_x0": 116.77,
- "r_y0": 329.54,
- "r_x1": 207.76,
- "r_y1": 329.54,
- "r_x2": 207.76,
- "r_y2": 315.82,
- "r_x3": 116.77,
- "r_y3": 315.82,
+ "r_x0": 406.33,
+ "r_y0": 121.67,
+ "r_x1": 518.33,
+ "r_y1": 121.67,
+ "r_x2": 518.33,
+ "r_y2": 105.67,
+ "r_x3": 406.33,
+ "r_y3": 105.67,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 25,
+ "id": 12,
"label": "text",
"bbox": {
- "l": 251.77,
- "t": 315.82,
- "r": 299.73,
- "b": 329.54,
+ "l": 429.33,
+ "t": 137.0,
+ "r": 499.33,
+ "b": 153.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 11,
@@ -1195,36 +1345,36 @@
"a": 255
},
"rect": {
- "r_x0": 251.77,
- "r_y0": 329.54,
- "r_x1": 299.73,
- "r_y1": 329.54,
- "r_x2": 299.73,
- "r_y2": 315.82,
- "r_x3": 251.77,
- "r_y3": 315.82,
+ "r_x0": 429.33,
+ "r_y0": 153.0,
+ "r_x1": 499.33,
+ "r_y1": 153.0,
+ "r_x2": 499.33,
+ "r_y2": 137.0,
+ "r_x3": 429.33,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 26,
+ "id": 13,
"label": "text",
"bbox": {
- "l": 484.65,
- "t": 315.82,
- "r": 522.85,
- "b": 329.54,
+ "l": 408.33,
+ "t": 188.33,
+ "r": 514.0,
+ "b": 204.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 12,
@@ -1235,21 +1385,141 @@
"a": 255
},
"rect": {
- "r_x0": 484.65,
- "r_y0": 329.54,
- "r_x1": 522.85,
- "r_y1": 329.54,
- "r_x2": 522.85,
- "r_y2": 315.82,
- "r_x3": 484.65,
- "r_y3": 315.82,
+ "r_x0": 408.33,
+ "r_y0": 204.33,
+ "r_x1": 514.0,
+ "r_y1": 204.33,
+ "r_x2": 514.0,
+ "r_y2": 188.33,
+ "r_x3": 408.33,
+ "r_y3": 188.33,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 14,
+ "label": "text",
+ "bbox": {
+ "l": 440.67,
+ "t": 220.0,
+ "r": 487.67,
+ "b": 236.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 440.67,
+ "r_y0": 236.0,
+ "r_x1": 487.67,
+ "r_y1": 236.0,
+ "r_x2": 487.67,
+ "r_y2": 220.0,
+ "r_x3": 440.67,
+ "r_y3": 220.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 15,
+ "label": "text",
+ "bbox": {
+ "l": 408.33,
+ "t": 268.0,
+ "r": 514.0,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 408.33,
+ "r_y0": 284.0,
+ "r_x1": 514.0,
+ "r_y1": 284.0,
+ "r_x2": 514.0,
+ "r_y2": 268.0,
+ "r_x3": 408.33,
+ "r_y3": 268.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 16,
+ "label": "text",
+ "bbox": {
+ "l": 440.67,
+ "t": 299.67,
+ "r": 487.67,
+ "b": 315.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 440.67,
+ "r_y0": 315.33,
+ "r_x1": 487.67,
+ "r_y1": 315.33,
+ "r_x2": 487.67,
+ "r_y2": 299.67,
+ "r_x3": 440.67,
+ "r_y3": 299.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
@@ -1268,13 +1538,13 @@
"id": 0,
"label": "table",
"bbox": {
- "l": 103.33,
- "t": 75.14,
- "r": 560.95,
- "b": 360.93,
+ "l": 69.05,
+ "t": 87.65,
+ "r": 551.1,
+ "b": 334.58,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.968,
+ "confidence": 0.979,
"cells": [
{
"index": 0,
@@ -1285,21 +1555,21 @@
"a": 255
},
"rect": {
- "r_x0": 245.02,
- "r_y0": 120.29,
- "r_x1": 307.59,
- "r_y1": 120.29,
- "r_x2": 307.59,
- "r_y2": 106.57,
- "r_x3": 245.02,
- "r_y3": 106.57,
+ "r_x0": 97.33,
+ "r_y0": 126.33,
+ "r_x1": 190.0,
+ "r_y1": 126.33,
+ "r_x2": 190.0,
+ "r_y2": 105.67,
+ "r_x3": 97.33,
+ "r_y3": 105.67,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 89.0,
+ "from_ocr": true
},
{
"index": 1,
@@ -1310,21 +1580,21 @@
"a": 255
},
"rect": {
- "r_x0": 358.65,
- "r_y0": 120.29,
- "r_x1": 421.22,
- "r_y1": 120.29,
- "r_x2": 421.22,
- "r_y2": 106.57,
- "r_x3": 358.65,
- "r_y3": 106.57,
+ "r_x0": 112.0,
+ "r_y0": 157.67,
+ "r_x1": 182.33,
+ "r_y1": 157.67,
+ "r_x2": 182.33,
+ "r_y2": 137.0,
+ "r_x3": 112.0,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 2,
@@ -1335,21 +1605,21 @@
"a": 255
},
"rect": {
- "r_x0": 472.27,
- "r_y0": 120.29,
- "r_x1": 534.84,
- "r_y1": 120.29,
- "r_x2": 534.84,
- "r_y2": 106.57,
- "r_x3": 472.27,
- "r_y3": 106.57,
+ "r_x0": 121.67,
+ "r_y0": 220.0,
+ "r_x1": 168.67,
+ "r_y1": 220.0,
+ "r_x2": 168.67,
+ "r_y2": 204.33,
+ "r_x3": 121.67,
+ "r_y3": 204.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 3,
@@ -1360,21 +1630,21 @@
"a": 255
},
"rect": {
- "r_x0": 123.52,
- "r_y0": 187.79,
- "r_x1": 200.67,
- "r_y1": 187.79,
- "r_x2": 200.67,
- "r_y2": 174.07,
- "r_x3": 123.52,
- "r_y3": 174.07,
+ "r_x0": 121.67,
+ "r_y0": 300.0,
+ "r_x1": 168.67,
+ "r_y1": 300.0,
+ "r_x2": 168.67,
+ "r_y2": 284.0,
+ "r_x3": 121.67,
+ "r_y3": 284.0,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 4,
@@ -1385,21 +1655,21 @@
"a": 255
},
"rect": {
- "r_x0": 241.65,
- "r_y0": 187.79,
- "r_x1": 310.71,
- "r_y1": 187.79,
- "r_x2": 310.71,
- "r_y2": 174.07,
- "r_x3": 241.65,
- "r_y3": 174.07,
+ "r_x0": 232.67,
+ "r_y0": 126.33,
+ "r_x1": 364.0,
+ "r_y1": 126.33,
+ "r_x2": 364.0,
+ "r_y2": 105.67,
+ "r_x3": 232.67,
+ "r_y3": 105.67,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 5,
@@ -1410,21 +1680,21 @@
"a": 255
},
"rect": {
- "r_x0": 347.4,
- "r_y0": 187.79,
- "r_x1": 431.1,
- "r_y1": 187.79,
- "r_x2": 431.1,
- "r_y2": 174.07,
- "r_x3": 347.4,
- "r_y3": 174.07,
+ "r_x0": 265.67,
+ "r_y0": 153.0,
+ "r_x1": 336.0,
+ "r_y1": 153.0,
+ "r_x2": 336.0,
+ "r_y2": 137.0,
+ "r_x3": 265.67,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 6,
@@ -1435,21 +1705,21 @@
"a": 255
},
"rect": {
- "r_x0": 491.4,
- "r_y0": 187.79,
- "r_x1": 515.79,
- "r_y1": 187.79,
- "r_x2": 515.79,
- "r_y2": 174.07,
- "r_x3": 491.4,
- "r_y3": 174.07,
+ "r_x0": 247.0,
+ "r_y0": 204.33,
+ "r_x1": 349.67,
+ "r_y1": 204.33,
+ "r_x2": 349.67,
+ "r_y2": 188.33,
+ "r_x3": 247.0,
+ "r_y3": 188.33,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 7,
@@ -1460,21 +1730,21 @@
"a": 255
},
"rect": {
- "r_x0": 130.27,
- "r_y0": 256.41,
- "r_x1": 194.46,
- "r_y1": 256.41,
- "r_x2": 194.46,
- "r_y2": 242.7,
- "r_x3": 130.27,
- "r_y3": 242.7,
+ "r_x0": 277.0,
+ "r_y0": 236.0,
+ "r_x1": 324.33,
+ "r_y1": 236.0,
+ "r_x2": 324.33,
+ "r_y2": 220.0,
+ "r_x3": 277.0,
+ "r_y3": 220.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 8,
@@ -1485,21 +1755,21 @@
"a": 255
},
"rect": {
- "r_x0": 373.27,
- "r_y0": 256.41,
- "r_x1": 406.59,
- "r_y1": 256.41,
- "r_x2": 406.59,
- "r_y2": 242.7,
- "r_x3": 373.27,
- "r_y3": 242.7,
+ "r_x0": 247.0,
+ "r_y0": 284.0,
+ "r_x1": 349.67,
+ "r_y1": 284.0,
+ "r_x2": 349.67,
+ "r_y2": 268.0,
+ "r_x3": 247.0,
+ "r_y3": 268.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 9,
@@ -1510,21 +1780,21 @@
"a": 255
},
"rect": {
- "r_x0": 486.9,
- "r_y0": 256.41,
- "r_x1": 518.61,
- "r_y1": 256.41,
- "r_x2": 518.61,
- "r_y2": 242.7,
- "r_x3": 486.9,
- "r_y3": 242.7,
+ "r_x0": 277.0,
+ "r_y0": 315.33,
+ "r_x1": 324.33,
+ "r_y1": 315.33,
+ "r_x2": 324.33,
+ "r_y2": 299.67,
+ "r_x3": 277.0,
+ "r_y3": 299.67,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 10,
@@ -1535,21 +1805,21 @@
"a": 255
},
"rect": {
- "r_x0": 116.77,
- "r_y0": 329.54,
- "r_x1": 207.76,
- "r_y1": 329.54,
- "r_x2": 207.76,
- "r_y2": 315.82,
- "r_x3": 116.77,
- "r_y3": 315.82,
+ "r_x0": 406.33,
+ "r_y0": 121.67,
+ "r_x1": 518.33,
+ "r_y1": 121.67,
+ "r_x2": 518.33,
+ "r_y2": 105.67,
+ "r_x3": 406.33,
+ "r_y3": 105.67,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 11,
@@ -1560,21 +1830,21 @@
"a": 255
},
"rect": {
- "r_x0": 251.77,
- "r_y0": 329.54,
- "r_x1": 299.73,
- "r_y1": 329.54,
- "r_x2": 299.73,
- "r_y2": 315.82,
- "r_x3": 251.77,
- "r_y3": 315.82,
+ "r_x0": 429.33,
+ "r_y0": 153.0,
+ "r_x1": 499.33,
+ "r_y1": 153.0,
+ "r_x2": 499.33,
+ "r_y2": 137.0,
+ "r_x3": 429.33,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 12,
@@ -1585,35 +1855,110 @@
"a": 255
},
"rect": {
- "r_x0": 484.65,
- "r_y0": 329.54,
- "r_x1": 522.85,
- "r_y1": 329.54,
- "r_x2": 522.85,
- "r_y2": 315.82,
- "r_x3": 484.65,
- "r_y3": 315.82,
+ "r_x0": 408.33,
+ "r_y0": 204.33,
+ "r_x1": 514.0,
+ "r_y1": 204.33,
+ "r_x2": 514.0,
+ "r_y2": 188.33,
+ "r_x3": 408.33,
+ "r_y3": 188.33,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 440.67,
+ "r_y0": 236.0,
+ "r_x1": 487.67,
+ "r_y1": 236.0,
+ "r_x2": 487.67,
+ "r_y2": 220.0,
+ "r_x3": 440.67,
+ "r_y3": 220.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 408.33,
+ "r_y0": 284.0,
+ "r_x1": 514.0,
+ "r_y1": 284.0,
+ "r_x2": 514.0,
+ "r_y2": 268.0,
+ "r_x3": 408.33,
+ "r_y3": 268.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 440.67,
+ "r_y0": 315.33,
+ "r_x1": 487.67,
+ "r_y1": 315.33,
+ "r_x2": 487.67,
+ "r_y2": 299.67,
+ "r_x3": 440.67,
+ "r_y3": 299.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": [
{
- "id": 14,
+ "id": 1,
"label": "text",
"bbox": {
- "l": 245.02,
- "t": 106.57,
- "r": 307.59,
- "b": 120.29,
+ "l": 97.33,
+ "t": 105.67,
+ "r": 190.0,
+ "b": 126.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 89.0,
"cells": [
{
"index": 0,
@@ -1624,36 +1969,36 @@
"a": 255
},
"rect": {
- "r_x0": 245.02,
- "r_y0": 120.29,
- "r_x1": 307.59,
- "r_y1": 120.29,
- "r_x2": 307.59,
- "r_y2": 106.57,
- "r_x3": 245.02,
- "r_y3": 106.57,
+ "r_x0": 97.33,
+ "r_y0": 126.33,
+ "r_x1": 190.0,
+ "r_y1": 126.33,
+ "r_x2": 190.0,
+ "r_y2": 105.67,
+ "r_x3": 97.33,
+ "r_y3": 105.67,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 89.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 15,
+ "id": 2,
"label": "text",
"bbox": {
- "l": 358.65,
- "t": 106.57,
- "r": 421.22,
- "b": 120.29,
+ "l": 112.0,
+ "t": 137.0,
+ "r": 182.33,
+ "b": 157.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 92.0,
"cells": [
{
"index": 1,
@@ -1664,36 +2009,36 @@
"a": 255
},
"rect": {
- "r_x0": 358.65,
- "r_y0": 120.29,
- "r_x1": 421.22,
- "r_y1": 120.29,
- "r_x2": 421.22,
- "r_y2": 106.57,
- "r_x3": 358.65,
- "r_y3": 106.57,
+ "r_x0": 112.0,
+ "r_y0": 157.67,
+ "r_x1": 182.33,
+ "r_y1": 157.67,
+ "r_x2": 182.33,
+ "r_y2": 137.0,
+ "r_x3": 112.0,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 16,
+ "id": 3,
"label": "text",
"bbox": {
- "l": 472.27,
- "t": 106.57,
- "r": 534.84,
- "b": 120.29,
+ "l": 121.67,
+ "t": 204.33,
+ "r": 168.67,
+ "b": 220.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 2,
@@ -1704,36 +2049,36 @@
"a": 255
},
"rect": {
- "r_x0": 472.27,
- "r_y0": 120.29,
- "r_x1": 534.84,
- "r_y1": 120.29,
- "r_x2": 534.84,
- "r_y2": 106.57,
- "r_x3": 472.27,
- "r_y3": 106.57,
+ "r_x0": 121.67,
+ "r_y0": 220.0,
+ "r_x1": 168.67,
+ "r_y1": 220.0,
+ "r_x2": 168.67,
+ "r_y2": 204.33,
+ "r_x3": 121.67,
+ "r_y3": 204.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 17,
+ "id": 4,
"label": "text",
"bbox": {
- "l": 123.52,
- "t": 174.07,
- "r": 200.67,
- "b": 187.79,
+ "l": 121.67,
+ "t": 284.0,
+ "r": 168.67,
+ "b": 300.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 3,
@@ -1744,36 +2089,36 @@
"a": 255
},
"rect": {
- "r_x0": 123.52,
- "r_y0": 187.79,
- "r_x1": 200.67,
- "r_y1": 187.79,
- "r_x2": 200.67,
- "r_y2": 174.07,
- "r_x3": 123.52,
- "r_y3": 174.07,
+ "r_x0": 121.67,
+ "r_y0": 300.0,
+ "r_x1": 168.67,
+ "r_y1": 300.0,
+ "r_x2": 168.67,
+ "r_y2": 284.0,
+ "r_x3": 121.67,
+ "r_y3": 284.0,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 18,
+ "id": 5,
"label": "text",
"bbox": {
- "l": 241.65,
- "t": 174.07,
- "r": 310.71,
- "b": 187.79,
+ "l": 232.67,
+ "t": 105.67,
+ "r": 364.0,
+ "b": 126.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 92.0,
"cells": [
{
"index": 4,
@@ -1784,36 +2129,36 @@
"a": 255
},
"rect": {
- "r_x0": 241.65,
- "r_y0": 187.79,
- "r_x1": 310.71,
- "r_y1": 187.79,
- "r_x2": 310.71,
- "r_y2": 174.07,
- "r_x3": 241.65,
- "r_y3": 174.07,
+ "r_x0": 232.67,
+ "r_y0": 126.33,
+ "r_x1": 364.0,
+ "r_y1": 126.33,
+ "r_x2": 364.0,
+ "r_y2": 105.67,
+ "r_x3": 232.67,
+ "r_y3": 105.67,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 19,
+ "id": 6,
"label": "text",
"bbox": {
- "l": 347.4,
- "t": 174.07,
- "r": 431.1,
- "b": 187.79,
+ "l": 265.67,
+ "t": 137.0,
+ "r": 336.0,
+ "b": 153.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 5,
@@ -1824,36 +2169,36 @@
"a": 255
},
"rect": {
- "r_x0": 347.4,
- "r_y0": 187.79,
- "r_x1": 431.1,
- "r_y1": 187.79,
- "r_x2": 431.1,
- "r_y2": 174.07,
- "r_x3": 347.4,
- "r_y3": 174.07,
+ "r_x0": 265.67,
+ "r_y0": 153.0,
+ "r_x1": 336.0,
+ "r_y1": 153.0,
+ "r_x2": 336.0,
+ "r_y2": 137.0,
+ "r_x3": 265.67,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 20,
+ "id": 7,
"label": "text",
"bbox": {
- "l": 491.4,
- "t": 174.07,
- "r": 515.79,
- "b": 187.79,
+ "l": 247.0,
+ "t": 188.33,
+ "r": 349.67,
+ "b": 204.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 6,
@@ -1864,36 +2209,36 @@
"a": 255
},
"rect": {
- "r_x0": 491.4,
- "r_y0": 187.79,
- "r_x1": 515.79,
- "r_y1": 187.79,
- "r_x2": 515.79,
- "r_y2": 174.07,
- "r_x3": 491.4,
- "r_y3": 174.07,
+ "r_x0": 247.0,
+ "r_y0": 204.33,
+ "r_x1": 349.67,
+ "r_y1": 204.33,
+ "r_x2": 349.67,
+ "r_y2": 188.33,
+ "r_x3": 247.0,
+ "r_y3": 188.33,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 21,
+ "id": 8,
"label": "text",
"bbox": {
- "l": 130.27,
- "t": 242.7,
- "r": 194.46,
- "b": 256.41,
+ "l": 277.0,
+ "t": 220.0,
+ "r": 324.33,
+ "b": 236.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 7,
@@ -1904,36 +2249,36 @@
"a": 255
},
"rect": {
- "r_x0": 130.27,
- "r_y0": 256.41,
- "r_x1": 194.46,
- "r_y1": 256.41,
- "r_x2": 194.46,
- "r_y2": 242.7,
- "r_x3": 130.27,
- "r_y3": 242.7,
+ "r_x0": 277.0,
+ "r_y0": 236.0,
+ "r_x1": 324.33,
+ "r_y1": 236.0,
+ "r_x2": 324.33,
+ "r_y2": 220.0,
+ "r_x3": 277.0,
+ "r_y3": 220.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 22,
+ "id": 9,
"label": "text",
"bbox": {
- "l": 373.27,
- "t": 242.7,
- "r": 406.59,
- "b": 256.41,
+ "l": 247.0,
+ "t": 268.0,
+ "r": 349.67,
+ "b": 284.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 92.0,
"cells": [
{
"index": 8,
@@ -1944,36 +2289,36 @@
"a": 255
},
"rect": {
- "r_x0": 373.27,
- "r_y0": 256.41,
- "r_x1": 406.59,
- "r_y1": 256.41,
- "r_x2": 406.59,
- "r_y2": 242.7,
- "r_x3": 373.27,
- "r_y3": 242.7,
+ "r_x0": 247.0,
+ "r_y0": 284.0,
+ "r_x1": 349.67,
+ "r_y1": 284.0,
+ "r_x2": 349.67,
+ "r_y2": 268.0,
+ "r_x3": 247.0,
+ "r_y3": 268.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 23,
+ "id": 10,
"label": "text",
"bbox": {
- "l": 486.9,
- "t": 242.7,
- "r": 518.61,
- "b": 256.41,
+ "l": 277.0,
+ "t": 299.67,
+ "r": 324.33,
+ "b": 315.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 9,
@@ -1984,36 +2329,36 @@
"a": 255
},
"rect": {
- "r_x0": 486.9,
- "r_y0": 256.41,
- "r_x1": 518.61,
- "r_y1": 256.41,
- "r_x2": 518.61,
- "r_y2": 242.7,
- "r_x3": 486.9,
- "r_y3": 242.7,
+ "r_x0": 277.0,
+ "r_y0": 315.33,
+ "r_x1": 324.33,
+ "r_y1": 315.33,
+ "r_x2": 324.33,
+ "r_y2": 299.67,
+ "r_x3": 277.0,
+ "r_y3": 299.67,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 24,
+ "id": 11,
"label": "text",
"bbox": {
- "l": 116.77,
- "t": 315.82,
- "r": 207.76,
- "b": 329.54,
+ "l": 406.33,
+ "t": 105.67,
+ "r": 518.33,
+ "b": 121.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 10,
@@ -2024,36 +2369,36 @@
"a": 255
},
"rect": {
- "r_x0": 116.77,
- "r_y0": 329.54,
- "r_x1": 207.76,
- "r_y1": 329.54,
- "r_x2": 207.76,
- "r_y2": 315.82,
- "r_x3": 116.77,
- "r_y3": 315.82,
+ "r_x0": 406.33,
+ "r_y0": 121.67,
+ "r_x1": 518.33,
+ "r_y1": 121.67,
+ "r_x2": 518.33,
+ "r_y2": 105.67,
+ "r_x3": 406.33,
+ "r_y3": 105.67,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 25,
+ "id": 12,
"label": "text",
"bbox": {
- "l": 251.77,
- "t": 315.82,
- "r": 299.73,
- "b": 329.54,
+ "l": 429.33,
+ "t": 137.0,
+ "r": 499.33,
+ "b": 153.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 11,
@@ -2064,36 +2409,36 @@
"a": 255
},
"rect": {
- "r_x0": 251.77,
- "r_y0": 329.54,
- "r_x1": 299.73,
- "r_y1": 329.54,
- "r_x2": 299.73,
- "r_y2": 315.82,
- "r_x3": 251.77,
- "r_y3": 315.82,
+ "r_x0": 429.33,
+ "r_y0": 153.0,
+ "r_x1": 499.33,
+ "r_y1": 153.0,
+ "r_x2": 499.33,
+ "r_y2": 137.0,
+ "r_x3": 429.33,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 26,
+ "id": 13,
"label": "text",
"bbox": {
- "l": 484.65,
- "t": 315.82,
- "r": 522.85,
- "b": 329.54,
+ "l": 408.33,
+ "t": 188.33,
+ "r": 514.0,
+ "b": 204.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 12,
@@ -2104,21 +2449,141 @@
"a": 255
},
"rect": {
- "r_x0": 484.65,
- "r_y0": 329.54,
- "r_x1": 522.85,
- "r_y1": 329.54,
- "r_x2": 522.85,
- "r_y2": 315.82,
- "r_x3": 484.65,
- "r_y3": 315.82,
+ "r_x0": 408.33,
+ "r_y0": 204.33,
+ "r_x1": 514.0,
+ "r_y1": 204.33,
+ "r_x2": 514.0,
+ "r_y2": 188.33,
+ "r_x3": 408.33,
+ "r_y3": 188.33,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 14,
+ "label": "text",
+ "bbox": {
+ "l": 440.67,
+ "t": 220.0,
+ "r": 487.67,
+ "b": 236.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 440.67,
+ "r_y0": 236.0,
+ "r_x1": 487.67,
+ "r_y1": 236.0,
+ "r_x2": 487.67,
+ "r_y2": 220.0,
+ "r_x3": 440.67,
+ "r_y3": 220.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 15,
+ "label": "text",
+ "bbox": {
+ "l": 408.33,
+ "t": 268.0,
+ "r": 514.0,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 408.33,
+ "r_y0": 284.0,
+ "r_x1": 514.0,
+ "r_y1": 284.0,
+ "r_x2": 514.0,
+ "r_y2": 268.0,
+ "r_x3": 408.33,
+ "r_y3": 268.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 16,
+ "label": "text",
+ "bbox": {
+ "l": 440.67,
+ "t": 299.67,
+ "r": 487.67,
+ "b": 315.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 440.67,
+ "r_y0": 315.33,
+ "r_x1": 487.67,
+ "r_y1": 315.33,
+ "r_x2": 487.67,
+ "r_y2": 299.67,
+ "r_x3": 440.67,
+ "r_y3": 299.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
@@ -2127,93 +2592,47 @@
},
"text": null,
"otsl_seq": [
- "ecel",
"ched",
"ched",
"ched",
"nl",
- "rhed",
"fcel",
"fcel",
"fcel",
"nl",
- "rhed",
- "ecel",
"fcel",
"fcel",
- "nl",
- "rhed",
- "fcel",
- "ecel",
"fcel",
"nl"
],
- "num_rows": 4,
- "num_cols": 4,
+ "num_rows": 3,
+ "num_cols": 3,
"table_cells": [
{
"bbox": {
- "l": 245.02,
- "t": 106.57,
- "r": 307.59,
- "b": 120.29,
+ "l": 97.33,
+ "t": 105.67,
+ "r": 190.0,
+ "b": 126.33,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
"col_span": 1,
"start_row_offset_idx": 0,
"end_row_offset_idx": 1,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "Column 0",
+ "start_col_offset_idx": 0,
+ "end_col_offset_idx": 1,
+ "text": "Vertically merged",
"column_header": true,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 358.65,
- "t": 106.57,
- "r": 421.22,
- "b": 120.29,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "Column 1",
- "column_header": true,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 472.27,
- "t": 106.57,
- "r": 534.84,
- "b": 120.29,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "Column 2",
- "column_header": true,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 123.52,
- "t": 174.07,
- "r": 200.67,
- "b": 187.79,
+ "l": 121.67,
+ "t": 204.33,
+ "r": 168.67,
+ "b": 220.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -2222,74 +2641,17 @@
"end_row_offset_idx": 2,
"start_col_offset_idx": 0,
"end_col_offset_idx": 1,
- "text": "this is row 0",
- "column_header": false,
- "row_header": true,
- "row_section": false
- },
- {
- "bbox": {
- "l": 241.65,
- "t": 174.07,
- "r": 310.71,
- "b": 187.79,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "some cells",
+ "text": "value",
"column_header": false,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 347.4,
- "t": 174.07,
- "r": 431.1,
- "b": 187.79,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "have content",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 491.4,
- "t": 174.07,
- "r": 515.79,
- "b": 187.79,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "and",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 130.27,
- "t": 242.7,
- "r": 194.46,
- "b": 256.41,
+ "l": 121.67,
+ "t": 284.0,
+ "r": 168.67,
+ "b": 300.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -2298,17 +2660,112 @@
"end_row_offset_idx": 3,
"start_col_offset_idx": 0,
"end_col_offset_idx": 1,
- "text": "and row 1",
+ "text": "value",
"column_header": false,
- "row_header": true,
+ "row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 373.27,
- "t": 242.7,
- "r": 406.59,
- "b": 256.41,
+ "l": 232.67,
+ "t": 105.67,
+ "r": 364.0,
+ "b": 126.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Other merged column",
+ "column_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 247.0,
+ "t": 188.33,
+ "r": 349.67,
+ "b": 204.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Some other value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 247.0,
+ "t": 268.0,
+ "r": 349.67,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 2,
+ "end_row_offset_idx": 3,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Some other value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 406.33,
+ "t": 105.67,
+ "r": 518.33,
+ "b": 121.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another column",
+ "column_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 408.33,
+ "t": 188.33,
+ "r": 514.0,
+ "b": 204.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 408.33,
+ "t": 268.0,
+ "r": 514.0,
+ "b": 284.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -2317,83 +2774,7 @@
"end_row_offset_idx": 3,
"start_col_offset_idx": 2,
"end_col_offset_idx": 3,
- "text": "other",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 486.9,
- "t": 242.7,
- "r": 518.61,
- "b": 256.41,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "have",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 116.77,
- "t": 315.82,
- "r": 207.76,
- "b": 329.54,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "and last row 2",
- "column_header": false,
- "row_header": true,
- "row_section": false
- },
- {
- "bbox": {
- "l": 251.77,
- "t": 315.82,
- "r": 299.73,
- "b": 329.54,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "nothing",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 484.65,
- "t": 315.82,
- "r": 522.85,
- "b": 329.54,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "inside",
+ "text": "Yet another value",
"column_header": false,
"row_header": false,
"row_section": false
@@ -2416,13 +2797,13 @@
"id": 0,
"label": "table",
"bbox": {
- "l": 103.33,
- "t": 75.14,
- "r": 560.95,
- "b": 360.93,
+ "l": 69.05,
+ "t": 87.65,
+ "r": 551.1,
+ "b": 334.58,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.968,
+ "confidence": 0.979,
"cells": [
{
"index": 0,
@@ -2433,21 +2814,21 @@
"a": 255
},
"rect": {
- "r_x0": 245.02,
- "r_y0": 120.29,
- "r_x1": 307.59,
- "r_y1": 120.29,
- "r_x2": 307.59,
- "r_y2": 106.57,
- "r_x3": 245.02,
- "r_y3": 106.57,
+ "r_x0": 97.33,
+ "r_y0": 126.33,
+ "r_x1": 190.0,
+ "r_y1": 126.33,
+ "r_x2": 190.0,
+ "r_y2": 105.67,
+ "r_x3": 97.33,
+ "r_y3": 105.67,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 89.0,
+ "from_ocr": true
},
{
"index": 1,
@@ -2458,21 +2839,21 @@
"a": 255
},
"rect": {
- "r_x0": 358.65,
- "r_y0": 120.29,
- "r_x1": 421.22,
- "r_y1": 120.29,
- "r_x2": 421.22,
- "r_y2": 106.57,
- "r_x3": 358.65,
- "r_y3": 106.57,
+ "r_x0": 112.0,
+ "r_y0": 157.67,
+ "r_x1": 182.33,
+ "r_y1": 157.67,
+ "r_x2": 182.33,
+ "r_y2": 137.0,
+ "r_x3": 112.0,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 2,
@@ -2483,21 +2864,21 @@
"a": 255
},
"rect": {
- "r_x0": 472.27,
- "r_y0": 120.29,
- "r_x1": 534.84,
- "r_y1": 120.29,
- "r_x2": 534.84,
- "r_y2": 106.57,
- "r_x3": 472.27,
- "r_y3": 106.57,
+ "r_x0": 121.67,
+ "r_y0": 220.0,
+ "r_x1": 168.67,
+ "r_y1": 220.0,
+ "r_x2": 168.67,
+ "r_y2": 204.33,
+ "r_x3": 121.67,
+ "r_y3": 204.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 3,
@@ -2508,21 +2889,21 @@
"a": 255
},
"rect": {
- "r_x0": 123.52,
- "r_y0": 187.79,
- "r_x1": 200.67,
- "r_y1": 187.79,
- "r_x2": 200.67,
- "r_y2": 174.07,
- "r_x3": 123.52,
- "r_y3": 174.07,
+ "r_x0": 121.67,
+ "r_y0": 300.0,
+ "r_x1": 168.67,
+ "r_y1": 300.0,
+ "r_x2": 168.67,
+ "r_y2": 284.0,
+ "r_x3": 121.67,
+ "r_y3": 284.0,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 4,
@@ -2533,21 +2914,21 @@
"a": 255
},
"rect": {
- "r_x0": 241.65,
- "r_y0": 187.79,
- "r_x1": 310.71,
- "r_y1": 187.79,
- "r_x2": 310.71,
- "r_y2": 174.07,
- "r_x3": 241.65,
- "r_y3": 174.07,
+ "r_x0": 232.67,
+ "r_y0": 126.33,
+ "r_x1": 364.0,
+ "r_y1": 126.33,
+ "r_x2": 364.0,
+ "r_y2": 105.67,
+ "r_x3": 232.67,
+ "r_y3": 105.67,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 5,
@@ -2558,21 +2939,21 @@
"a": 255
},
"rect": {
- "r_x0": 347.4,
- "r_y0": 187.79,
- "r_x1": 431.1,
- "r_y1": 187.79,
- "r_x2": 431.1,
- "r_y2": 174.07,
- "r_x3": 347.4,
- "r_y3": 174.07,
+ "r_x0": 265.67,
+ "r_y0": 153.0,
+ "r_x1": 336.0,
+ "r_y1": 153.0,
+ "r_x2": 336.0,
+ "r_y2": 137.0,
+ "r_x3": 265.67,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 6,
@@ -2583,21 +2964,21 @@
"a": 255
},
"rect": {
- "r_x0": 491.4,
- "r_y0": 187.79,
- "r_x1": 515.79,
- "r_y1": 187.79,
- "r_x2": 515.79,
- "r_y2": 174.07,
- "r_x3": 491.4,
- "r_y3": 174.07,
+ "r_x0": 247.0,
+ "r_y0": 204.33,
+ "r_x1": 349.67,
+ "r_y1": 204.33,
+ "r_x2": 349.67,
+ "r_y2": 188.33,
+ "r_x3": 247.0,
+ "r_y3": 188.33,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 7,
@@ -2608,21 +2989,21 @@
"a": 255
},
"rect": {
- "r_x0": 130.27,
- "r_y0": 256.41,
- "r_x1": 194.46,
- "r_y1": 256.41,
- "r_x2": 194.46,
- "r_y2": 242.7,
- "r_x3": 130.27,
- "r_y3": 242.7,
+ "r_x0": 277.0,
+ "r_y0": 236.0,
+ "r_x1": 324.33,
+ "r_y1": 236.0,
+ "r_x2": 324.33,
+ "r_y2": 220.0,
+ "r_x3": 277.0,
+ "r_y3": 220.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 8,
@@ -2633,21 +3014,21 @@
"a": 255
},
"rect": {
- "r_x0": 373.27,
- "r_y0": 256.41,
- "r_x1": 406.59,
- "r_y1": 256.41,
- "r_x2": 406.59,
- "r_y2": 242.7,
- "r_x3": 373.27,
- "r_y3": 242.7,
+ "r_x0": 247.0,
+ "r_y0": 284.0,
+ "r_x1": 349.67,
+ "r_y1": 284.0,
+ "r_x2": 349.67,
+ "r_y2": 268.0,
+ "r_x3": 247.0,
+ "r_y3": 268.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 9,
@@ -2658,21 +3039,21 @@
"a": 255
},
"rect": {
- "r_x0": 486.9,
- "r_y0": 256.41,
- "r_x1": 518.61,
- "r_y1": 256.41,
- "r_x2": 518.61,
- "r_y2": 242.7,
- "r_x3": 486.9,
- "r_y3": 242.7,
+ "r_x0": 277.0,
+ "r_y0": 315.33,
+ "r_x1": 324.33,
+ "r_y1": 315.33,
+ "r_x2": 324.33,
+ "r_y2": 299.67,
+ "r_x3": 277.0,
+ "r_y3": 299.67,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 10,
@@ -2683,21 +3064,21 @@
"a": 255
},
"rect": {
- "r_x0": 116.77,
- "r_y0": 329.54,
- "r_x1": 207.76,
- "r_y1": 329.54,
- "r_x2": 207.76,
- "r_y2": 315.82,
- "r_x3": 116.77,
- "r_y3": 315.82,
+ "r_x0": 406.33,
+ "r_y0": 121.67,
+ "r_x1": 518.33,
+ "r_y1": 121.67,
+ "r_x2": 518.33,
+ "r_y2": 105.67,
+ "r_x3": 406.33,
+ "r_y3": 105.67,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 11,
@@ -2708,21 +3089,21 @@
"a": 255
},
"rect": {
- "r_x0": 251.77,
- "r_y0": 329.54,
- "r_x1": 299.73,
- "r_y1": 329.54,
- "r_x2": 299.73,
- "r_y2": 315.82,
- "r_x3": 251.77,
- "r_y3": 315.82,
+ "r_x0": 429.33,
+ "r_y0": 153.0,
+ "r_x1": 499.33,
+ "r_y1": 153.0,
+ "r_x2": 499.33,
+ "r_y2": 137.0,
+ "r_x3": 429.33,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 12,
@@ -2733,35 +3114,110 @@
"a": 255
},
"rect": {
- "r_x0": 484.65,
- "r_y0": 329.54,
- "r_x1": 522.85,
- "r_y1": 329.54,
- "r_x2": 522.85,
- "r_y2": 315.82,
- "r_x3": 484.65,
- "r_y3": 315.82,
+ "r_x0": 408.33,
+ "r_y0": 204.33,
+ "r_x1": 514.0,
+ "r_y1": 204.33,
+ "r_x2": 514.0,
+ "r_y2": 188.33,
+ "r_x3": 408.33,
+ "r_y3": 188.33,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 440.67,
+ "r_y0": 236.0,
+ "r_x1": 487.67,
+ "r_y1": 236.0,
+ "r_x2": 487.67,
+ "r_y2": 220.0,
+ "r_x3": 440.67,
+ "r_y3": 220.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 408.33,
+ "r_y0": 284.0,
+ "r_x1": 514.0,
+ "r_y1": 284.0,
+ "r_x2": 514.0,
+ "r_y2": 268.0,
+ "r_x3": 408.33,
+ "r_y3": 268.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 440.67,
+ "r_y0": 315.33,
+ "r_x1": 487.67,
+ "r_y1": 315.33,
+ "r_x2": 487.67,
+ "r_y2": 299.67,
+ "r_x3": 440.67,
+ "r_y3": 299.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": [
{
- "id": 14,
+ "id": 1,
"label": "text",
"bbox": {
- "l": 245.02,
- "t": 106.57,
- "r": 307.59,
- "b": 120.29,
+ "l": 97.33,
+ "t": 105.67,
+ "r": 190.0,
+ "b": 126.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 89.0,
"cells": [
{
"index": 0,
@@ -2772,36 +3228,36 @@
"a": 255
},
"rect": {
- "r_x0": 245.02,
- "r_y0": 120.29,
- "r_x1": 307.59,
- "r_y1": 120.29,
- "r_x2": 307.59,
- "r_y2": 106.57,
- "r_x3": 245.02,
- "r_y3": 106.57,
+ "r_x0": 97.33,
+ "r_y0": 126.33,
+ "r_x1": 190.0,
+ "r_y1": 126.33,
+ "r_x2": 190.0,
+ "r_y2": 105.67,
+ "r_x3": 97.33,
+ "r_y3": 105.67,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 89.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 15,
+ "id": 2,
"label": "text",
"bbox": {
- "l": 358.65,
- "t": 106.57,
- "r": 421.22,
- "b": 120.29,
+ "l": 112.0,
+ "t": 137.0,
+ "r": 182.33,
+ "b": 157.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 92.0,
"cells": [
{
"index": 1,
@@ -2812,36 +3268,36 @@
"a": 255
},
"rect": {
- "r_x0": 358.65,
- "r_y0": 120.29,
- "r_x1": 421.22,
- "r_y1": 120.29,
- "r_x2": 421.22,
- "r_y2": 106.57,
- "r_x3": 358.65,
- "r_y3": 106.57,
+ "r_x0": 112.0,
+ "r_y0": 157.67,
+ "r_x1": 182.33,
+ "r_y1": 157.67,
+ "r_x2": 182.33,
+ "r_y2": 137.0,
+ "r_x3": 112.0,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 16,
+ "id": 3,
"label": "text",
"bbox": {
- "l": 472.27,
- "t": 106.57,
- "r": 534.84,
- "b": 120.29,
+ "l": 121.67,
+ "t": 204.33,
+ "r": 168.67,
+ "b": 220.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 2,
@@ -2852,36 +3308,36 @@
"a": 255
},
"rect": {
- "r_x0": 472.27,
- "r_y0": 120.29,
- "r_x1": 534.84,
- "r_y1": 120.29,
- "r_x2": 534.84,
- "r_y2": 106.57,
- "r_x3": 472.27,
- "r_y3": 106.57,
+ "r_x0": 121.67,
+ "r_y0": 220.0,
+ "r_x1": 168.67,
+ "r_y1": 220.0,
+ "r_x2": 168.67,
+ "r_y2": 204.33,
+ "r_x3": 121.67,
+ "r_y3": 204.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 17,
+ "id": 4,
"label": "text",
"bbox": {
- "l": 123.52,
- "t": 174.07,
- "r": 200.67,
- "b": 187.79,
+ "l": 121.67,
+ "t": 284.0,
+ "r": 168.67,
+ "b": 300.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 3,
@@ -2892,36 +3348,36 @@
"a": 255
},
"rect": {
- "r_x0": 123.52,
- "r_y0": 187.79,
- "r_x1": 200.67,
- "r_y1": 187.79,
- "r_x2": 200.67,
- "r_y2": 174.07,
- "r_x3": 123.52,
- "r_y3": 174.07,
+ "r_x0": 121.67,
+ "r_y0": 300.0,
+ "r_x1": 168.67,
+ "r_y1": 300.0,
+ "r_x2": 168.67,
+ "r_y2": 284.0,
+ "r_x3": 121.67,
+ "r_y3": 284.0,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 18,
+ "id": 5,
"label": "text",
"bbox": {
- "l": 241.65,
- "t": 174.07,
- "r": 310.71,
- "b": 187.79,
+ "l": 232.67,
+ "t": 105.67,
+ "r": 364.0,
+ "b": 126.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 92.0,
"cells": [
{
"index": 4,
@@ -2932,36 +3388,36 @@
"a": 255
},
"rect": {
- "r_x0": 241.65,
- "r_y0": 187.79,
- "r_x1": 310.71,
- "r_y1": 187.79,
- "r_x2": 310.71,
- "r_y2": 174.07,
- "r_x3": 241.65,
- "r_y3": 174.07,
+ "r_x0": 232.67,
+ "r_y0": 126.33,
+ "r_x1": 364.0,
+ "r_y1": 126.33,
+ "r_x2": 364.0,
+ "r_y2": 105.67,
+ "r_x3": 232.67,
+ "r_y3": 105.67,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 19,
+ "id": 6,
"label": "text",
"bbox": {
- "l": 347.4,
- "t": 174.07,
- "r": 431.1,
- "b": 187.79,
+ "l": 265.67,
+ "t": 137.0,
+ "r": 336.0,
+ "b": 153.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 5,
@@ -2972,36 +3428,36 @@
"a": 255
},
"rect": {
- "r_x0": 347.4,
- "r_y0": 187.79,
- "r_x1": 431.1,
- "r_y1": 187.79,
- "r_x2": 431.1,
- "r_y2": 174.07,
- "r_x3": 347.4,
- "r_y3": 174.07,
+ "r_x0": 265.67,
+ "r_y0": 153.0,
+ "r_x1": 336.0,
+ "r_y1": 153.0,
+ "r_x2": 336.0,
+ "r_y2": 137.0,
+ "r_x3": 265.67,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 20,
+ "id": 7,
"label": "text",
"bbox": {
- "l": 491.4,
- "t": 174.07,
- "r": 515.79,
- "b": 187.79,
+ "l": 247.0,
+ "t": 188.33,
+ "r": 349.67,
+ "b": 204.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 6,
@@ -3012,36 +3468,36 @@
"a": 255
},
"rect": {
- "r_x0": 491.4,
- "r_y0": 187.79,
- "r_x1": 515.79,
- "r_y1": 187.79,
- "r_x2": 515.79,
- "r_y2": 174.07,
- "r_x3": 491.4,
- "r_y3": 174.07,
+ "r_x0": 247.0,
+ "r_y0": 204.33,
+ "r_x1": 349.67,
+ "r_y1": 204.33,
+ "r_x2": 349.67,
+ "r_y2": 188.33,
+ "r_x3": 247.0,
+ "r_y3": 188.33,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 21,
+ "id": 8,
"label": "text",
"bbox": {
- "l": 130.27,
- "t": 242.7,
- "r": 194.46,
- "b": 256.41,
+ "l": 277.0,
+ "t": 220.0,
+ "r": 324.33,
+ "b": 236.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 7,
@@ -3052,36 +3508,36 @@
"a": 255
},
"rect": {
- "r_x0": 130.27,
- "r_y0": 256.41,
- "r_x1": 194.46,
- "r_y1": 256.41,
- "r_x2": 194.46,
- "r_y2": 242.7,
- "r_x3": 130.27,
- "r_y3": 242.7,
+ "r_x0": 277.0,
+ "r_y0": 236.0,
+ "r_x1": 324.33,
+ "r_y1": 236.0,
+ "r_x2": 324.33,
+ "r_y2": 220.0,
+ "r_x3": 277.0,
+ "r_y3": 220.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 22,
+ "id": 9,
"label": "text",
"bbox": {
- "l": 373.27,
- "t": 242.7,
- "r": 406.59,
- "b": 256.41,
+ "l": 247.0,
+ "t": 268.0,
+ "r": 349.67,
+ "b": 284.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 92.0,
"cells": [
{
"index": 8,
@@ -3092,36 +3548,36 @@
"a": 255
},
"rect": {
- "r_x0": 373.27,
- "r_y0": 256.41,
- "r_x1": 406.59,
- "r_y1": 256.41,
- "r_x2": 406.59,
- "r_y2": 242.7,
- "r_x3": 373.27,
- "r_y3": 242.7,
+ "r_x0": 247.0,
+ "r_y0": 284.0,
+ "r_x1": 349.67,
+ "r_y1": 284.0,
+ "r_x2": 349.67,
+ "r_y2": 268.0,
+ "r_x3": 247.0,
+ "r_y3": 268.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 23,
+ "id": 10,
"label": "text",
"bbox": {
- "l": 486.9,
- "t": 242.7,
- "r": 518.61,
- "b": 256.41,
+ "l": 277.0,
+ "t": 299.67,
+ "r": 324.33,
+ "b": 315.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 9,
@@ -3132,36 +3588,36 @@
"a": 255
},
"rect": {
- "r_x0": 486.9,
- "r_y0": 256.41,
- "r_x1": 518.61,
- "r_y1": 256.41,
- "r_x2": 518.61,
- "r_y2": 242.7,
- "r_x3": 486.9,
- "r_y3": 242.7,
+ "r_x0": 277.0,
+ "r_y0": 315.33,
+ "r_x1": 324.33,
+ "r_y1": 315.33,
+ "r_x2": 324.33,
+ "r_y2": 299.67,
+ "r_x3": 277.0,
+ "r_y3": 299.67,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 24,
+ "id": 11,
"label": "text",
"bbox": {
- "l": 116.77,
- "t": 315.82,
- "r": 207.76,
- "b": 329.54,
+ "l": 406.33,
+ "t": 105.67,
+ "r": 518.33,
+ "b": 121.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 10,
@@ -3172,36 +3628,36 @@
"a": 255
},
"rect": {
- "r_x0": 116.77,
- "r_y0": 329.54,
- "r_x1": 207.76,
- "r_y1": 329.54,
- "r_x2": 207.76,
- "r_y2": 315.82,
- "r_x3": 116.77,
- "r_y3": 315.82,
+ "r_x0": 406.33,
+ "r_y0": 121.67,
+ "r_x1": 518.33,
+ "r_y1": 121.67,
+ "r_x2": 518.33,
+ "r_y2": 105.67,
+ "r_x3": 406.33,
+ "r_y3": 105.67,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 25,
+ "id": 12,
"label": "text",
"bbox": {
- "l": 251.77,
- "t": 315.82,
- "r": 299.73,
- "b": 329.54,
+ "l": 429.33,
+ "t": 137.0,
+ "r": 499.33,
+ "b": 153.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 11,
@@ -3212,36 +3668,36 @@
"a": 255
},
"rect": {
- "r_x0": 251.77,
- "r_y0": 329.54,
- "r_x1": 299.73,
- "r_y1": 329.54,
- "r_x2": 299.73,
- "r_y2": 315.82,
- "r_x3": 251.77,
- "r_y3": 315.82,
+ "r_x0": 429.33,
+ "r_y0": 153.0,
+ "r_x1": 499.33,
+ "r_y1": 153.0,
+ "r_x2": 499.33,
+ "r_y2": 137.0,
+ "r_x3": 429.33,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 26,
+ "id": 13,
"label": "text",
"bbox": {
- "l": 484.65,
- "t": 315.82,
- "r": 522.85,
- "b": 329.54,
+ "l": 408.33,
+ "t": 188.33,
+ "r": 514.0,
+ "b": 204.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 12,
@@ -3252,21 +3708,141 @@
"a": 255
},
"rect": {
- "r_x0": 484.65,
- "r_y0": 329.54,
- "r_x1": 522.85,
- "r_y1": 329.54,
- "r_x2": 522.85,
- "r_y2": 315.82,
- "r_x3": 484.65,
- "r_y3": 315.82,
+ "r_x0": 408.33,
+ "r_y0": 204.33,
+ "r_x1": 514.0,
+ "r_y1": 204.33,
+ "r_x2": 514.0,
+ "r_y2": 188.33,
+ "r_x3": 408.33,
+ "r_y3": 188.33,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 14,
+ "label": "text",
+ "bbox": {
+ "l": 440.67,
+ "t": 220.0,
+ "r": 487.67,
+ "b": 236.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 440.67,
+ "r_y0": 236.0,
+ "r_x1": 487.67,
+ "r_y1": 236.0,
+ "r_x2": 487.67,
+ "r_y2": 220.0,
+ "r_x3": 440.67,
+ "r_y3": 220.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 15,
+ "label": "text",
+ "bbox": {
+ "l": 408.33,
+ "t": 268.0,
+ "r": 514.0,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 408.33,
+ "r_y0": 284.0,
+ "r_x1": 514.0,
+ "r_y1": 284.0,
+ "r_x2": 514.0,
+ "r_y2": 268.0,
+ "r_x3": 408.33,
+ "r_y3": 268.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 16,
+ "label": "text",
+ "bbox": {
+ "l": 440.67,
+ "t": 299.67,
+ "r": 487.67,
+ "b": 315.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 440.67,
+ "r_y0": 315.33,
+ "r_x1": 487.67,
+ "r_y1": 315.33,
+ "r_x2": 487.67,
+ "r_y2": 299.67,
+ "r_x3": 440.67,
+ "r_y3": 299.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
@@ -3275,93 +3851,47 @@
},
"text": null,
"otsl_seq": [
- "ecel",
"ched",
"ched",
"ched",
"nl",
- "rhed",
"fcel",
"fcel",
"fcel",
"nl",
- "rhed",
- "ecel",
"fcel",
"fcel",
- "nl",
- "rhed",
- "fcel",
- "ecel",
"fcel",
"nl"
],
- "num_rows": 4,
- "num_cols": 4,
+ "num_rows": 3,
+ "num_cols": 3,
"table_cells": [
{
"bbox": {
- "l": 245.02,
- "t": 106.57,
- "r": 307.59,
- "b": 120.29,
+ "l": 97.33,
+ "t": 105.67,
+ "r": 190.0,
+ "b": 126.33,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
"col_span": 1,
"start_row_offset_idx": 0,
"end_row_offset_idx": 1,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "Column 0",
+ "start_col_offset_idx": 0,
+ "end_col_offset_idx": 1,
+ "text": "Vertically merged",
"column_header": true,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 358.65,
- "t": 106.57,
- "r": 421.22,
- "b": 120.29,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "Column 1",
- "column_header": true,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 472.27,
- "t": 106.57,
- "r": 534.84,
- "b": 120.29,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "Column 2",
- "column_header": true,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 123.52,
- "t": 174.07,
- "r": 200.67,
- "b": 187.79,
+ "l": 121.67,
+ "t": 204.33,
+ "r": 168.67,
+ "b": 220.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -3370,74 +3900,17 @@
"end_row_offset_idx": 2,
"start_col_offset_idx": 0,
"end_col_offset_idx": 1,
- "text": "this is row 0",
- "column_header": false,
- "row_header": true,
- "row_section": false
- },
- {
- "bbox": {
- "l": 241.65,
- "t": 174.07,
- "r": 310.71,
- "b": 187.79,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "some cells",
+ "text": "value",
"column_header": false,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 347.4,
- "t": 174.07,
- "r": 431.1,
- "b": 187.79,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "have content",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 491.4,
- "t": 174.07,
- "r": 515.79,
- "b": 187.79,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "and",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 130.27,
- "t": 242.7,
- "r": 194.46,
- "b": 256.41,
+ "l": 121.67,
+ "t": 284.0,
+ "r": 168.67,
+ "b": 300.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -3446,17 +3919,112 @@
"end_row_offset_idx": 3,
"start_col_offset_idx": 0,
"end_col_offset_idx": 1,
- "text": "and row 1",
+ "text": "value",
"column_header": false,
- "row_header": true,
+ "row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 373.27,
- "t": 242.7,
- "r": 406.59,
- "b": 256.41,
+ "l": 232.67,
+ "t": 105.67,
+ "r": 364.0,
+ "b": 126.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Other merged column",
+ "column_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 247.0,
+ "t": 188.33,
+ "r": 349.67,
+ "b": 204.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Some other value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 247.0,
+ "t": 268.0,
+ "r": 349.67,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 2,
+ "end_row_offset_idx": 3,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Some other value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 406.33,
+ "t": 105.67,
+ "r": 518.33,
+ "b": 121.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another column",
+ "column_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 408.33,
+ "t": 188.33,
+ "r": 514.0,
+ "b": 204.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 408.33,
+ "t": 268.0,
+ "r": 514.0,
+ "b": 284.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -3465,83 +4033,7 @@
"end_row_offset_idx": 3,
"start_col_offset_idx": 2,
"end_col_offset_idx": 3,
- "text": "other",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 486.9,
- "t": 242.7,
- "r": 518.61,
- "b": 256.41,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "have",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 116.77,
- "t": 315.82,
- "r": 207.76,
- "b": 329.54,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "and last row 2",
- "column_header": false,
- "row_header": true,
- "row_section": false
- },
- {
- "bbox": {
- "l": 251.77,
- "t": 315.82,
- "r": 299.73,
- "b": 329.54,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "nothing",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 484.65,
- "t": 315.82,
- "r": 522.85,
- "b": 329.54,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "inside",
+ "text": "Yet another value",
"column_header": false,
"row_header": false,
"row_section": false
@@ -3558,13 +4050,13 @@
"id": 0,
"label": "table",
"bbox": {
- "l": 103.33,
- "t": 75.14,
- "r": 560.95,
- "b": 360.93,
+ "l": 69.05,
+ "t": 87.65,
+ "r": 551.1,
+ "b": 334.58,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.968,
+ "confidence": 0.979,
"cells": [
{
"index": 0,
@@ -3575,21 +4067,21 @@
"a": 255
},
"rect": {
- "r_x0": 245.02,
- "r_y0": 120.29,
- "r_x1": 307.59,
- "r_y1": 120.29,
- "r_x2": 307.59,
- "r_y2": 106.57,
- "r_x3": 245.02,
- "r_y3": 106.57,
+ "r_x0": 97.33,
+ "r_y0": 126.33,
+ "r_x1": 190.0,
+ "r_y1": 126.33,
+ "r_x2": 190.0,
+ "r_y2": 105.67,
+ "r_x3": 97.33,
+ "r_y3": 105.67,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 89.0,
+ "from_ocr": true
},
{
"index": 1,
@@ -3600,21 +4092,21 @@
"a": 255
},
"rect": {
- "r_x0": 358.65,
- "r_y0": 120.29,
- "r_x1": 421.22,
- "r_y1": 120.29,
- "r_x2": 421.22,
- "r_y2": 106.57,
- "r_x3": 358.65,
- "r_y3": 106.57,
+ "r_x0": 112.0,
+ "r_y0": 157.67,
+ "r_x1": 182.33,
+ "r_y1": 157.67,
+ "r_x2": 182.33,
+ "r_y2": 137.0,
+ "r_x3": 112.0,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 2,
@@ -3625,21 +4117,21 @@
"a": 255
},
"rect": {
- "r_x0": 472.27,
- "r_y0": 120.29,
- "r_x1": 534.84,
- "r_y1": 120.29,
- "r_x2": 534.84,
- "r_y2": 106.57,
- "r_x3": 472.27,
- "r_y3": 106.57,
+ "r_x0": 121.67,
+ "r_y0": 220.0,
+ "r_x1": 168.67,
+ "r_y1": 220.0,
+ "r_x2": 168.67,
+ "r_y2": 204.33,
+ "r_x3": 121.67,
+ "r_y3": 204.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 3,
@@ -3650,21 +4142,21 @@
"a": 255
},
"rect": {
- "r_x0": 123.52,
- "r_y0": 187.79,
- "r_x1": 200.67,
- "r_y1": 187.79,
- "r_x2": 200.67,
- "r_y2": 174.07,
- "r_x3": 123.52,
- "r_y3": 174.07,
+ "r_x0": 121.67,
+ "r_y0": 300.0,
+ "r_x1": 168.67,
+ "r_y1": 300.0,
+ "r_x2": 168.67,
+ "r_y2": 284.0,
+ "r_x3": 121.67,
+ "r_y3": 284.0,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 4,
@@ -3675,21 +4167,21 @@
"a": 255
},
"rect": {
- "r_x0": 241.65,
- "r_y0": 187.79,
- "r_x1": 310.71,
- "r_y1": 187.79,
- "r_x2": 310.71,
- "r_y2": 174.07,
- "r_x3": 241.65,
- "r_y3": 174.07,
+ "r_x0": 232.67,
+ "r_y0": 126.33,
+ "r_x1": 364.0,
+ "r_y1": 126.33,
+ "r_x2": 364.0,
+ "r_y2": 105.67,
+ "r_x3": 232.67,
+ "r_y3": 105.67,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 5,
@@ -3700,21 +4192,21 @@
"a": 255
},
"rect": {
- "r_x0": 347.4,
- "r_y0": 187.79,
- "r_x1": 431.1,
- "r_y1": 187.79,
- "r_x2": 431.1,
- "r_y2": 174.07,
- "r_x3": 347.4,
- "r_y3": 174.07,
+ "r_x0": 265.67,
+ "r_y0": 153.0,
+ "r_x1": 336.0,
+ "r_y1": 153.0,
+ "r_x2": 336.0,
+ "r_y2": 137.0,
+ "r_x3": 265.67,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 6,
@@ -3725,21 +4217,21 @@
"a": 255
},
"rect": {
- "r_x0": 491.4,
- "r_y0": 187.79,
- "r_x1": 515.79,
- "r_y1": 187.79,
- "r_x2": 515.79,
- "r_y2": 174.07,
- "r_x3": 491.4,
- "r_y3": 174.07,
+ "r_x0": 247.0,
+ "r_y0": 204.33,
+ "r_x1": 349.67,
+ "r_y1": 204.33,
+ "r_x2": 349.67,
+ "r_y2": 188.33,
+ "r_x3": 247.0,
+ "r_y3": 188.33,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 7,
@@ -3750,21 +4242,21 @@
"a": 255
},
"rect": {
- "r_x0": 130.27,
- "r_y0": 256.41,
- "r_x1": 194.46,
- "r_y1": 256.41,
- "r_x2": 194.46,
- "r_y2": 242.7,
- "r_x3": 130.27,
- "r_y3": 242.7,
+ "r_x0": 277.0,
+ "r_y0": 236.0,
+ "r_x1": 324.33,
+ "r_y1": 236.0,
+ "r_x2": 324.33,
+ "r_y2": 220.0,
+ "r_x3": 277.0,
+ "r_y3": 220.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 8,
@@ -3775,21 +4267,21 @@
"a": 255
},
"rect": {
- "r_x0": 373.27,
- "r_y0": 256.41,
- "r_x1": 406.59,
- "r_y1": 256.41,
- "r_x2": 406.59,
- "r_y2": 242.7,
- "r_x3": 373.27,
- "r_y3": 242.7,
+ "r_x0": 247.0,
+ "r_y0": 284.0,
+ "r_x1": 349.67,
+ "r_y1": 284.0,
+ "r_x2": 349.67,
+ "r_y2": 268.0,
+ "r_x3": 247.0,
+ "r_y3": 268.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 9,
@@ -3800,21 +4292,21 @@
"a": 255
},
"rect": {
- "r_x0": 486.9,
- "r_y0": 256.41,
- "r_x1": 518.61,
- "r_y1": 256.41,
- "r_x2": 518.61,
- "r_y2": 242.7,
- "r_x3": 486.9,
- "r_y3": 242.7,
+ "r_x0": 277.0,
+ "r_y0": 315.33,
+ "r_x1": 324.33,
+ "r_y1": 315.33,
+ "r_x2": 324.33,
+ "r_y2": 299.67,
+ "r_x3": 277.0,
+ "r_y3": 299.67,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 10,
@@ -3825,21 +4317,21 @@
"a": 255
},
"rect": {
- "r_x0": 116.77,
- "r_y0": 329.54,
- "r_x1": 207.76,
- "r_y1": 329.54,
- "r_x2": 207.76,
- "r_y2": 315.82,
- "r_x3": 116.77,
- "r_y3": 315.82,
+ "r_x0": 406.33,
+ "r_y0": 121.67,
+ "r_x1": 518.33,
+ "r_y1": 121.67,
+ "r_x2": 518.33,
+ "r_y2": 105.67,
+ "r_x3": 406.33,
+ "r_y3": 105.67,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 11,
@@ -3850,21 +4342,21 @@
"a": 255
},
"rect": {
- "r_x0": 251.77,
- "r_y0": 329.54,
- "r_x1": 299.73,
- "r_y1": 329.54,
- "r_x2": 299.73,
- "r_y2": 315.82,
- "r_x3": 251.77,
- "r_y3": 315.82,
+ "r_x0": 429.33,
+ "r_y0": 153.0,
+ "r_x1": 499.33,
+ "r_y1": 153.0,
+ "r_x2": 499.33,
+ "r_y2": 137.0,
+ "r_x3": 429.33,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 12,
@@ -3875,35 +4367,110 @@
"a": 255
},
"rect": {
- "r_x0": 484.65,
- "r_y0": 329.54,
- "r_x1": 522.85,
- "r_y1": 329.54,
- "r_x2": 522.85,
- "r_y2": 315.82,
- "r_x3": 484.65,
- "r_y3": 315.82,
+ "r_x0": 408.33,
+ "r_y0": 204.33,
+ "r_x1": 514.0,
+ "r_y1": 204.33,
+ "r_x2": 514.0,
+ "r_y2": 188.33,
+ "r_x3": 408.33,
+ "r_y3": 188.33,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 440.67,
+ "r_y0": 236.0,
+ "r_x1": 487.67,
+ "r_y1": 236.0,
+ "r_x2": 487.67,
+ "r_y2": 220.0,
+ "r_x3": 440.67,
+ "r_y3": 220.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 408.33,
+ "r_y0": 284.0,
+ "r_x1": 514.0,
+ "r_y1": 284.0,
+ "r_x2": 514.0,
+ "r_y2": 268.0,
+ "r_x3": 408.33,
+ "r_y3": 268.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 440.67,
+ "r_y0": 315.33,
+ "r_x1": 487.67,
+ "r_y1": 315.33,
+ "r_x2": 487.67,
+ "r_y2": 299.67,
+ "r_x3": 440.67,
+ "r_y3": 299.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": [
{
- "id": 14,
+ "id": 1,
"label": "text",
"bbox": {
- "l": 245.02,
- "t": 106.57,
- "r": 307.59,
- "b": 120.29,
+ "l": 97.33,
+ "t": 105.67,
+ "r": 190.0,
+ "b": 126.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 89.0,
"cells": [
{
"index": 0,
@@ -3914,36 +4481,36 @@
"a": 255
},
"rect": {
- "r_x0": 245.02,
- "r_y0": 120.29,
- "r_x1": 307.59,
- "r_y1": 120.29,
- "r_x2": 307.59,
- "r_y2": 106.57,
- "r_x3": 245.02,
- "r_y3": 106.57,
+ "r_x0": 97.33,
+ "r_y0": 126.33,
+ "r_x1": 190.0,
+ "r_y1": 126.33,
+ "r_x2": 190.0,
+ "r_y2": 105.67,
+ "r_x3": 97.33,
+ "r_y3": 105.67,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 89.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 15,
+ "id": 2,
"label": "text",
"bbox": {
- "l": 358.65,
- "t": 106.57,
- "r": 421.22,
- "b": 120.29,
+ "l": 112.0,
+ "t": 137.0,
+ "r": 182.33,
+ "b": 157.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 92.0,
"cells": [
{
"index": 1,
@@ -3954,36 +4521,36 @@
"a": 255
},
"rect": {
- "r_x0": 358.65,
- "r_y0": 120.29,
- "r_x1": 421.22,
- "r_y1": 120.29,
- "r_x2": 421.22,
- "r_y2": 106.57,
- "r_x3": 358.65,
- "r_y3": 106.57,
+ "r_x0": 112.0,
+ "r_y0": 157.67,
+ "r_x1": 182.33,
+ "r_y1": 157.67,
+ "r_x2": 182.33,
+ "r_y2": 137.0,
+ "r_x3": 112.0,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 16,
+ "id": 3,
"label": "text",
"bbox": {
- "l": 472.27,
- "t": 106.57,
- "r": 534.84,
- "b": 120.29,
+ "l": 121.67,
+ "t": 204.33,
+ "r": 168.67,
+ "b": 220.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 2,
@@ -3994,36 +4561,36 @@
"a": 255
},
"rect": {
- "r_x0": 472.27,
- "r_y0": 120.29,
- "r_x1": 534.84,
- "r_y1": 120.29,
- "r_x2": 534.84,
- "r_y2": 106.57,
- "r_x3": 472.27,
- "r_y3": 106.57,
+ "r_x0": 121.67,
+ "r_y0": 220.0,
+ "r_x1": 168.67,
+ "r_y1": 220.0,
+ "r_x2": 168.67,
+ "r_y2": 204.33,
+ "r_x3": 121.67,
+ "r_y3": 204.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 17,
+ "id": 4,
"label": "text",
"bbox": {
- "l": 123.52,
- "t": 174.07,
- "r": 200.67,
- "b": 187.79,
+ "l": 121.67,
+ "t": 284.0,
+ "r": 168.67,
+ "b": 300.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 3,
@@ -4034,36 +4601,36 @@
"a": 255
},
"rect": {
- "r_x0": 123.52,
- "r_y0": 187.79,
- "r_x1": 200.67,
- "r_y1": 187.79,
- "r_x2": 200.67,
- "r_y2": 174.07,
- "r_x3": 123.52,
- "r_y3": 174.07,
+ "r_x0": 121.67,
+ "r_y0": 300.0,
+ "r_x1": 168.67,
+ "r_y1": 300.0,
+ "r_x2": 168.67,
+ "r_y2": 284.0,
+ "r_x3": 121.67,
+ "r_y3": 284.0,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 18,
+ "id": 5,
"label": "text",
"bbox": {
- "l": 241.65,
- "t": 174.07,
- "r": 310.71,
- "b": 187.79,
+ "l": 232.67,
+ "t": 105.67,
+ "r": 364.0,
+ "b": 126.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 92.0,
"cells": [
{
"index": 4,
@@ -4074,36 +4641,36 @@
"a": 255
},
"rect": {
- "r_x0": 241.65,
- "r_y0": 187.79,
- "r_x1": 310.71,
- "r_y1": 187.79,
- "r_x2": 310.71,
- "r_y2": 174.07,
- "r_x3": 241.65,
- "r_y3": 174.07,
+ "r_x0": 232.67,
+ "r_y0": 126.33,
+ "r_x1": 364.0,
+ "r_y1": 126.33,
+ "r_x2": 364.0,
+ "r_y2": 105.67,
+ "r_x3": 232.67,
+ "r_y3": 105.67,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 19,
+ "id": 6,
"label": "text",
"bbox": {
- "l": 347.4,
- "t": 174.07,
- "r": 431.1,
- "b": 187.79,
+ "l": 265.67,
+ "t": 137.0,
+ "r": 336.0,
+ "b": 153.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 5,
@@ -4114,36 +4681,36 @@
"a": 255
},
"rect": {
- "r_x0": 347.4,
- "r_y0": 187.79,
- "r_x1": 431.1,
- "r_y1": 187.79,
- "r_x2": 431.1,
- "r_y2": 174.07,
- "r_x3": 347.4,
- "r_y3": 174.07,
+ "r_x0": 265.67,
+ "r_y0": 153.0,
+ "r_x1": 336.0,
+ "r_y1": 153.0,
+ "r_x2": 336.0,
+ "r_y2": 137.0,
+ "r_x3": 265.67,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 20,
+ "id": 7,
"label": "text",
"bbox": {
- "l": 491.4,
- "t": 174.07,
- "r": 515.79,
- "b": 187.79,
+ "l": 247.0,
+ "t": 188.33,
+ "r": 349.67,
+ "b": 204.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 6,
@@ -4154,36 +4721,36 @@
"a": 255
},
"rect": {
- "r_x0": 491.4,
- "r_y0": 187.79,
- "r_x1": 515.79,
- "r_y1": 187.79,
- "r_x2": 515.79,
- "r_y2": 174.07,
- "r_x3": 491.4,
- "r_y3": 174.07,
+ "r_x0": 247.0,
+ "r_y0": 204.33,
+ "r_x1": 349.67,
+ "r_y1": 204.33,
+ "r_x2": 349.67,
+ "r_y2": 188.33,
+ "r_x3": 247.0,
+ "r_y3": 188.33,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 21,
+ "id": 8,
"label": "text",
"bbox": {
- "l": 130.27,
- "t": 242.7,
- "r": 194.46,
- "b": 256.41,
+ "l": 277.0,
+ "t": 220.0,
+ "r": 324.33,
+ "b": 236.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 7,
@@ -4194,36 +4761,36 @@
"a": 255
},
"rect": {
- "r_x0": 130.27,
- "r_y0": 256.41,
- "r_x1": 194.46,
- "r_y1": 256.41,
- "r_x2": 194.46,
- "r_y2": 242.7,
- "r_x3": 130.27,
- "r_y3": 242.7,
+ "r_x0": 277.0,
+ "r_y0": 236.0,
+ "r_x1": 324.33,
+ "r_y1": 236.0,
+ "r_x2": 324.33,
+ "r_y2": 220.0,
+ "r_x3": 277.0,
+ "r_y3": 220.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 22,
+ "id": 9,
"label": "text",
"bbox": {
- "l": 373.27,
- "t": 242.7,
- "r": 406.59,
- "b": 256.41,
+ "l": 247.0,
+ "t": 268.0,
+ "r": 349.67,
+ "b": 284.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 92.0,
"cells": [
{
"index": 8,
@@ -4234,36 +4801,36 @@
"a": 255
},
"rect": {
- "r_x0": 373.27,
- "r_y0": 256.41,
- "r_x1": 406.59,
- "r_y1": 256.41,
- "r_x2": 406.59,
- "r_y2": 242.7,
- "r_x3": 373.27,
- "r_y3": 242.7,
+ "r_x0": 247.0,
+ "r_y0": 284.0,
+ "r_x1": 349.67,
+ "r_y1": 284.0,
+ "r_x2": 349.67,
+ "r_y2": 268.0,
+ "r_x3": 247.0,
+ "r_y3": 268.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 23,
+ "id": 10,
"label": "text",
"bbox": {
- "l": 486.9,
- "t": 242.7,
- "r": 518.61,
- "b": 256.41,
+ "l": 277.0,
+ "t": 299.67,
+ "r": 324.33,
+ "b": 315.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 9,
@@ -4274,36 +4841,36 @@
"a": 255
},
"rect": {
- "r_x0": 486.9,
- "r_y0": 256.41,
- "r_x1": 518.61,
- "r_y1": 256.41,
- "r_x2": 518.61,
- "r_y2": 242.7,
- "r_x3": 486.9,
- "r_y3": 242.7,
+ "r_x0": 277.0,
+ "r_y0": 315.33,
+ "r_x1": 324.33,
+ "r_y1": 315.33,
+ "r_x2": 324.33,
+ "r_y2": 299.67,
+ "r_x3": 277.0,
+ "r_y3": 299.67,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 24,
+ "id": 11,
"label": "text",
"bbox": {
- "l": 116.77,
- "t": 315.82,
- "r": 207.76,
- "b": 329.54,
+ "l": 406.33,
+ "t": 105.67,
+ "r": 518.33,
+ "b": 121.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 10,
@@ -4314,36 +4881,36 @@
"a": 255
},
"rect": {
- "r_x0": 116.77,
- "r_y0": 329.54,
- "r_x1": 207.76,
- "r_y1": 329.54,
- "r_x2": 207.76,
- "r_y2": 315.82,
- "r_x3": 116.77,
- "r_y3": 315.82,
+ "r_x0": 406.33,
+ "r_y0": 121.67,
+ "r_x1": 518.33,
+ "r_y1": 121.67,
+ "r_x2": 518.33,
+ "r_y2": 105.67,
+ "r_x3": 406.33,
+ "r_y3": 105.67,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 25,
+ "id": 12,
"label": "text",
"bbox": {
- "l": 251.77,
- "t": 315.82,
- "r": 299.73,
- "b": 329.54,
+ "l": 429.33,
+ "t": 137.0,
+ "r": 499.33,
+ "b": 153.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 11,
@@ -4354,36 +4921,36 @@
"a": 255
},
"rect": {
- "r_x0": 251.77,
- "r_y0": 329.54,
- "r_x1": 299.73,
- "r_y1": 329.54,
- "r_x2": 299.73,
- "r_y2": 315.82,
- "r_x3": 251.77,
- "r_y3": 315.82,
+ "r_x0": 429.33,
+ "r_y0": 153.0,
+ "r_x1": 499.33,
+ "r_y1": 153.0,
+ "r_x2": 499.33,
+ "r_y2": 137.0,
+ "r_x3": 429.33,
+ "r_y3": 137.0,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 26,
+ "id": 13,
"label": "text",
"bbox": {
- "l": 484.65,
- "t": 315.82,
- "r": 522.85,
- "b": 329.54,
+ "l": 408.33,
+ "t": 188.33,
+ "r": 514.0,
+ "b": 204.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 12,
@@ -4394,21 +4961,141 @@
"a": 255
},
"rect": {
- "r_x0": 484.65,
- "r_y0": 329.54,
- "r_x1": 522.85,
- "r_y1": 329.54,
- "r_x2": 522.85,
- "r_y2": 315.82,
- "r_x3": 484.65,
- "r_y3": 315.82,
+ "r_x0": 408.33,
+ "r_y0": 204.33,
+ "r_x1": 514.0,
+ "r_y1": 204.33,
+ "r_x2": 514.0,
+ "r_y2": 188.33,
+ "r_x3": 408.33,
+ "r_y3": 188.33,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 14,
+ "label": "text",
+ "bbox": {
+ "l": 440.67,
+ "t": 220.0,
+ "r": 487.67,
+ "b": 236.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 440.67,
+ "r_y0": 236.0,
+ "r_x1": 487.67,
+ "r_y1": 236.0,
+ "r_x2": 487.67,
+ "r_y2": 220.0,
+ "r_x3": 440.67,
+ "r_y3": 220.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 15,
+ "label": "text",
+ "bbox": {
+ "l": 408.33,
+ "t": 268.0,
+ "r": 514.0,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 408.33,
+ "r_y0": 284.0,
+ "r_x1": 514.0,
+ "r_y1": 284.0,
+ "r_x2": 514.0,
+ "r_y2": 268.0,
+ "r_x3": 408.33,
+ "r_y3": 268.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 16,
+ "label": "text",
+ "bbox": {
+ "l": 440.67,
+ "t": 299.67,
+ "r": 487.67,
+ "b": 315.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 440.67,
+ "r_y0": 315.33,
+ "r_x1": 487.67,
+ "r_y1": 315.33,
+ "r_x2": 487.67,
+ "r_y2": 299.67,
+ "r_x3": 440.67,
+ "r_y3": 299.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
@@ -4417,93 +5104,47 @@
},
"text": null,
"otsl_seq": [
- "ecel",
"ched",
"ched",
"ched",
"nl",
- "rhed",
"fcel",
"fcel",
"fcel",
"nl",
- "rhed",
- "ecel",
"fcel",
"fcel",
- "nl",
- "rhed",
- "fcel",
- "ecel",
"fcel",
"nl"
],
- "num_rows": 4,
- "num_cols": 4,
+ "num_rows": 3,
+ "num_cols": 3,
"table_cells": [
{
"bbox": {
- "l": 245.02,
- "t": 106.57,
- "r": 307.59,
- "b": 120.29,
+ "l": 97.33,
+ "t": 105.67,
+ "r": 190.0,
+ "b": 126.33,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
"col_span": 1,
"start_row_offset_idx": 0,
"end_row_offset_idx": 1,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "Column 0",
+ "start_col_offset_idx": 0,
+ "end_col_offset_idx": 1,
+ "text": "Vertically merged",
"column_header": true,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 358.65,
- "t": 106.57,
- "r": 421.22,
- "b": 120.29,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "Column 1",
- "column_header": true,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 472.27,
- "t": 106.57,
- "r": 534.84,
- "b": 120.29,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "Column 2",
- "column_header": true,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 123.52,
- "t": 174.07,
- "r": 200.67,
- "b": 187.79,
+ "l": 121.67,
+ "t": 204.33,
+ "r": 168.67,
+ "b": 220.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -4512,74 +5153,17 @@
"end_row_offset_idx": 2,
"start_col_offset_idx": 0,
"end_col_offset_idx": 1,
- "text": "this is row 0",
- "column_header": false,
- "row_header": true,
- "row_section": false
- },
- {
- "bbox": {
- "l": 241.65,
- "t": 174.07,
- "r": 310.71,
- "b": 187.79,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "some cells",
+ "text": "value",
"column_header": false,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 347.4,
- "t": 174.07,
- "r": 431.1,
- "b": 187.79,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "have content",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 491.4,
- "t": 174.07,
- "r": 515.79,
- "b": 187.79,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "and",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 130.27,
- "t": 242.7,
- "r": 194.46,
- "b": 256.41,
+ "l": 121.67,
+ "t": 284.0,
+ "r": 168.67,
+ "b": 300.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -4588,17 +5172,112 @@
"end_row_offset_idx": 3,
"start_col_offset_idx": 0,
"end_col_offset_idx": 1,
- "text": "and row 1",
+ "text": "value",
"column_header": false,
- "row_header": true,
+ "row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 373.27,
- "t": 242.7,
- "r": 406.59,
- "b": 256.41,
+ "l": 232.67,
+ "t": 105.67,
+ "r": 364.0,
+ "b": 126.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Other merged column",
+ "column_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 247.0,
+ "t": 188.33,
+ "r": 349.67,
+ "b": 204.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Some other value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 247.0,
+ "t": 268.0,
+ "r": 349.67,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 2,
+ "end_row_offset_idx": 3,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Some other value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 406.33,
+ "t": 105.67,
+ "r": 518.33,
+ "b": 121.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another column",
+ "column_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 408.33,
+ "t": 188.33,
+ "r": 514.0,
+ "b": 204.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 408.33,
+ "t": 268.0,
+ "r": 514.0,
+ "b": 284.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -4607,83 +5286,7 @@
"end_row_offset_idx": 3,
"start_col_offset_idx": 2,
"end_col_offset_idx": 3,
- "text": "other",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 486.9,
- "t": 242.7,
- "r": 518.61,
- "b": 256.41,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "have",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 116.77,
- "t": 315.82,
- "r": 207.76,
- "b": 329.54,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "and last row 2",
- "column_header": false,
- "row_header": true,
- "row_section": false
- },
- {
- "bbox": {
- "l": 251.77,
- "t": 315.82,
- "r": 299.73,
- "b": 329.54,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "nothing",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 484.65,
- "t": 315.82,
- "r": 522.85,
- "b": 329.54,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "inside",
+ "text": "Yet another value",
"column_header": false,
"row_header": false,
"row_section": false
diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_180.doctags.txt b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_180.doctags.txt
index 0eab0ecc..1d7f0742 100644
--- a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_180.doctags.txt
+++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_180.doctags.txt
@@ -1,2 +1,2 @@
-insidenothingand last row 2haveotherand row 1andhave contentsome cellsthis is row 0Column 2Column 1Column 0
+Vertically mergedOther merged columnYet another columnvalueSome other valueYet another valuevalueSome other valueYet another value
\ No newline at end of file
diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_180.json b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_180.json
index aec34f31..76cc6098 100644
--- a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_180.json
+++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_180.json
@@ -4,7 +4,7 @@
"name": "ocr_test_rotated_180",
"origin": {
"mimetype": "application/pdf",
- "binary_hash": 9953198396702586979,
+ "binary_hash": 16151733167151414937,
"filename": "ocr_test_rotated_180.pdf"
},
"furniture": {
@@ -41,10 +41,10 @@
{
"page_no": 1,
"bbox": {
- "l": 280.59,
- "t": 361.27,
- "r": 738.57,
- "b": 75.91,
+ "l": 240.9,
+ "t": 334.58,
+ "r": 722.95,
+ "b": 87.65,
"coord_origin": "BOTTOMLEFT"
},
"charspan": [
@@ -60,238 +60,10 @@
"table_cells": [
{
"bbox": {
- "l": 534.41,
- "t": 474.71,
- "r": 596.97,
- "b": 488.43,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "Column 0",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 420.78,
- "t": 474.71,
- "r": 483.35,
- "b": 488.43,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "Column 1",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 307.16,
- "t": 474.71,
- "r": 369.73,
- "b": 488.43,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "Column 2",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 641.33,
- "t": 407.21,
- "r": 718.47,
- "b": 420.93,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "this is row 0",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 531.29,
- "t": 407.21,
- "r": 600.35,
- "b": 420.93,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "some cells",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 410.9,
- "t": 407.21,
- "r": 494.6,
- "b": 420.93,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "have content",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 326.21,
- "t": 407.21,
- "r": 350.6,
- "b": 420.93,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "and",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 647.54,
- "t": 338.59,
- "r": 711.72,
- "b": 352.3,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "and row 1",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 435.41,
- "t": 338.59,
- "r": 468.73,
- "b": 352.3,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "other",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 323.39,
- "t": 338.59,
- "r": 355.1,
- "b": 352.3,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "have",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 634.24,
- "t": 265.46,
- "r": 725.22,
- "b": 279.18,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "and last row 2",
- "column_header": true,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 542.27,
- "t": 265.46,
- "r": 590.22,
- "b": 279.18,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "nothing",
- "column_header": true,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 319.15,
- "t": 265.46,
- "r": 357.35,
- "b": 279.18,
+ "l": 97.33,
+ "t": 105.67,
+ "r": 190.0,
+ "b": 126.33,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -300,22 +72,174 @@
"end_row_offset_idx": 1,
"start_col_offset_idx": 0,
"end_col_offset_idx": 1,
- "text": "inside",
+ "text": "Vertically merged",
"column_header": true,
"row_header": false,
"row_section": false
+ },
+ {
+ "bbox": {
+ "l": 121.67,
+ "t": 204.0,
+ "r": 168.67,
+ "b": 220.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 0,
+ "end_col_offset_idx": 1,
+ "text": "value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 121.67,
+ "t": 284.0,
+ "r": 168.67,
+ "b": 300.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 2,
+ "end_row_offset_idx": 3,
+ "start_col_offset_idx": 0,
+ "end_col_offset_idx": 1,
+ "text": "value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 232.33,
+ "t": 105.67,
+ "r": 363.67,
+ "b": 126.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Other merged column",
+ "column_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 247.0,
+ "t": 188.0,
+ "r": 349.67,
+ "b": 204.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Some other value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 247.0,
+ "t": 268.0,
+ "r": 349.67,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 2,
+ "end_row_offset_idx": 3,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Some other value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 406.33,
+ "t": 105.67,
+ "r": 518.0,
+ "b": 121.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another column",
+ "column_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 408.33,
+ "t": 188.0,
+ "r": 514.0,
+ "b": 204.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 408.33,
+ "t": 268.0,
+ "r": 514.0,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 2,
+ "end_row_offset_idx": 3,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
}
],
- "num_rows": 4,
- "num_cols": 4,
+ "num_rows": 3,
+ "num_cols": 3,
"grid": [
[
{
"bbox": {
- "l": 319.15,
- "t": 265.46,
- "r": 357.35,
- "b": 279.18,
+ "l": 97.33,
+ "t": 105.67,
+ "r": 190.0,
+ "b": 126.33,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -324,29 +248,36 @@
"end_row_offset_idx": 1,
"start_col_offset_idx": 0,
"end_col_offset_idx": 1,
- "text": "inside",
+ "text": "Vertically merged",
"column_header": true,
"row_header": false,
"row_section": false
},
{
+ "bbox": {
+ "l": 232.33,
+ "t": 105.67,
+ "r": 363.67,
+ "b": 126.33,
+ "coord_origin": "TOPLEFT"
+ },
"row_span": 1,
"col_span": 1,
"start_row_offset_idx": 0,
"end_row_offset_idx": 1,
"start_col_offset_idx": 1,
"end_col_offset_idx": 2,
- "text": "",
- "column_header": false,
+ "text": "Other merged column",
+ "column_header": true,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 542.27,
- "t": 265.46,
- "r": 590.22,
- "b": 279.18,
+ "l": 406.33,
+ "t": 105.67,
+ "r": 518.0,
+ "b": 121.67,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -355,26 +286,7 @@
"end_row_offset_idx": 1,
"start_col_offset_idx": 2,
"end_col_offset_idx": 3,
- "text": "nothing",
- "column_header": true,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 634.24,
- "t": 265.46,
- "r": 725.22,
- "b": 279.18,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "and last row 2",
+ "text": "Yet another column",
"column_header": true,
"row_header": false,
"row_section": false
@@ -383,10 +295,10 @@
[
{
"bbox": {
- "l": 323.39,
- "t": 338.59,
- "r": 355.1,
- "b": 352.3,
+ "l": 121.67,
+ "t": 204.0,
+ "r": 168.67,
+ "b": 220.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -395,17 +307,17 @@
"end_row_offset_idx": 2,
"start_col_offset_idx": 0,
"end_col_offset_idx": 1,
- "text": "have",
+ "text": "value",
"column_header": false,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 435.41,
- "t": 338.59,
- "r": 468.73,
- "b": 352.3,
+ "l": 247.0,
+ "t": 188.0,
+ "r": 349.67,
+ "b": 204.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -414,38 +326,26 @@
"end_row_offset_idx": 2,
"start_col_offset_idx": 1,
"end_col_offset_idx": 2,
- "text": "other",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "",
+ "text": "Some other value",
"column_header": false,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 647.54,
- "t": 338.59,
- "r": 711.72,
- "b": 352.3,
+ "l": 408.33,
+ "t": 188.0,
+ "r": 514.0,
+ "b": 204.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
"col_span": 1,
"start_row_offset_idx": 1,
"end_row_offset_idx": 2,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "and row 1",
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another value",
"column_header": false,
"row_header": false,
"row_section": false
@@ -454,10 +354,10 @@
[
{
"bbox": {
- "l": 326.21,
- "t": 407.21,
- "r": 350.6,
- "b": 420.93,
+ "l": 121.67,
+ "t": 284.0,
+ "r": 168.67,
+ "b": 300.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -466,17 +366,17 @@
"end_row_offset_idx": 3,
"start_col_offset_idx": 0,
"end_col_offset_idx": 1,
- "text": "and",
+ "text": "value",
"column_header": false,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 410.9,
- "t": 407.21,
- "r": 494.6,
- "b": 420.93,
+ "l": 247.0,
+ "t": 268.0,
+ "r": 349.67,
+ "b": 284.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -485,17 +385,17 @@
"end_row_offset_idx": 3,
"start_col_offset_idx": 1,
"end_col_offset_idx": 2,
- "text": "have content",
+ "text": "Some other value",
"column_header": false,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 531.29,
- "t": 407.21,
- "r": 600.35,
- "b": 420.93,
+ "l": 408.33,
+ "t": 268.0,
+ "r": 514.0,
+ "b": 284.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -504,97 +404,7 @@
"end_row_offset_idx": 3,
"start_col_offset_idx": 2,
"end_col_offset_idx": 3,
- "text": "some cells",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 641.33,
- "t": 407.21,
- "r": 718.47,
- "b": 420.93,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "this is row 0",
- "column_header": false,
- "row_header": false,
- "row_section": false
- }
- ],
- [
- {
- "bbox": {
- "l": 307.16,
- "t": 474.71,
- "r": 369.73,
- "b": 488.43,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "Column 2",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 420.78,
- "t": 474.71,
- "r": 483.35,
- "b": 488.43,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "Column 1",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 534.41,
- "t": 474.71,
- "r": 596.97,
- "b": 488.43,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "Column 0",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "",
+ "text": "Yet another value",
"column_header": false,
"row_header": false,
"row_section": false
@@ -610,8 +420,8 @@
"pages": {
"1": {
"size": {
- "width": 842.0,
- "height": 595.0
+ "width": 792.0,
+ "height": 612.0
},
"page_no": 1
}
diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_180.md b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_180.md
index 8521b3f9..e3d7c0b8 100644
--- a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_180.md
+++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_180.md
@@ -1,5 +1,4 @@
-| inside | | nothing | and last row 2 |
-|----------|--------------|------------|------------------|
-| have | other | | and row 1 |
-| and | have content | some cells | this is row 0 |
-| Column 2 | Column 1 | Column 0 | |
\ No newline at end of file
+| Vertically merged | Other merged column | Yet another column |
+|---------------------|-----------------------|----------------------|
+| value | Some other value | Yet another value |
+| value | Some other value | Yet another value |
\ No newline at end of file
diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_180.pages.json b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_180.pages.json
index 256df68f..6d1b52fb 100644
--- a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_180.pages.json
+++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_180.pages.json
@@ -2,8 +2,8 @@
{
"page_no": 0,
"size": {
- "width": 842.0,
- "height": 595.0
+ "width": 792.0,
+ "height": 612.0
},
"parsed_page": {
"dimension": {
@@ -11,47 +11,47 @@
"rect": {
"r_x0": 0.0,
"r_y0": 0.0,
- "r_x1": 842.0,
+ "r_x1": 792.0,
"r_y1": 0.0,
- "r_x2": 842.0,
- "r_y2": 595.0,
+ "r_x2": 792.0,
+ "r_y2": 612.0,
"r_x3": 0.0,
- "r_y3": 595.0,
+ "r_y3": 612.0,
"coord_origin": "BOTTOMLEFT"
},
"boundary_type": "crop_box",
"art_bbox": {
"l": 0.0,
- "t": 595.0,
- "r": 842.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
},
"bleed_bbox": {
"l": 0.0,
- "t": 595.0,
- "r": 842.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
},
"crop_bbox": {
"l": 0.0,
- "t": 595.0,
- "r": 842.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
},
"media_bbox": {
"l": 0.0,
- "t": 595.0,
- "r": 842.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
},
"trim_bbox": {
"l": 0.0,
- "t": 595.0,
- "r": 842.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
}
@@ -69,21 +69,21 @@
"a": 255
},
"rect": {
- "r_x0": 534.41,
- "r_y0": 488.43,
- "r_x1": 596.97,
- "r_y1": 488.43,
- "r_x2": 596.97,
- "r_y2": 474.71,
- "r_x3": 534.41,
- "r_y3": 474.71,
+ "r_x0": 694.67,
+ "r_y0": 485.67,
+ "r_x1": 602.0,
+ "r_y1": 485.67,
+ "r_x2": 602.0,
+ "r_y2": 506.33,
+ "r_x3": 694.67,
+ "r_y3": 506.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
},
{
"index": 1,
@@ -94,21 +94,21 @@
"a": 255
},
"rect": {
- "r_x0": 420.78,
- "r_y0": 488.43,
- "r_x1": 483.35,
- "r_y1": 488.43,
- "r_x2": 483.35,
- "r_y2": 474.71,
- "r_x3": 420.78,
- "r_y3": 474.71,
+ "r_x0": 680.0,
+ "r_y0": 454.33,
+ "r_x1": 610.0,
+ "r_y1": 454.33,
+ "r_x2": 610.0,
+ "r_y2": 475.0,
+ "r_x3": 680.0,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
},
{
"index": 2,
@@ -119,21 +119,21 @@
"a": 255
},
"rect": {
- "r_x0": 307.16,
- "r_y0": 488.43,
- "r_x1": 369.73,
- "r_y1": 488.43,
- "r_x2": 369.73,
- "r_y2": 474.71,
- "r_x3": 307.16,
- "r_y3": 474.71,
+ "r_x0": 670.33,
+ "r_y0": 392.0,
+ "r_x1": 623.33,
+ "r_y1": 392.0,
+ "r_x2": 623.33,
+ "r_y2": 408.0,
+ "r_x3": 670.33,
+ "r_y3": 408.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 3,
@@ -144,21 +144,21 @@
"a": 255
},
"rect": {
- "r_x0": 641.33,
- "r_y0": 420.93,
- "r_x1": 718.47,
- "r_y1": 420.93,
- "r_x2": 718.47,
- "r_y2": 407.21,
- "r_x3": 641.33,
- "r_y3": 407.21,
+ "r_x0": 670.33,
+ "r_y0": 312.0,
+ "r_x1": 623.33,
+ "r_y1": 312.0,
+ "r_x2": 623.33,
+ "r_y2": 328.0,
+ "r_x3": 670.33,
+ "r_y3": 328.0,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 4,
@@ -169,21 +169,21 @@
"a": 255
},
"rect": {
- "r_x0": 531.29,
- "r_y0": 420.93,
- "r_x1": 600.35,
- "r_y1": 420.93,
- "r_x2": 600.35,
- "r_y2": 407.21,
- "r_x3": 531.29,
- "r_y3": 407.21,
+ "r_x0": 559.67,
+ "r_y0": 485.67,
+ "r_x1": 428.33,
+ "r_y1": 485.67,
+ "r_x2": 428.33,
+ "r_y2": 506.33,
+ "r_x3": 559.67,
+ "r_y3": 506.33,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 5,
@@ -194,21 +194,21 @@
"a": 255
},
"rect": {
- "r_x0": 410.9,
- "r_y0": 420.93,
- "r_x1": 494.6,
- "r_y1": 420.93,
- "r_x2": 494.6,
- "r_y2": 407.21,
- "r_x3": 410.9,
- "r_y3": 407.21,
+ "r_x0": 526.67,
+ "r_y0": 459.0,
+ "r_x1": 456.0,
+ "r_y1": 459.0,
+ "r_x2": 456.0,
+ "r_y2": 475.0,
+ "r_x3": 526.67,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 6,
@@ -219,21 +219,21 @@
"a": 255
},
"rect": {
- "r_x0": 326.21,
- "r_y0": 420.93,
- "r_x1": 350.6,
- "r_y1": 420.93,
- "r_x2": 350.6,
- "r_y2": 407.21,
- "r_x3": 326.21,
- "r_y3": 407.21,
+ "r_x0": 545.0,
+ "r_y0": 408.0,
+ "r_x1": 442.33,
+ "r_y1": 408.0,
+ "r_x2": 442.33,
+ "r_y2": 424.0,
+ "r_x3": 545.0,
+ "r_y3": 424.0,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 91.0,
+ "from_ocr": true
},
{
"index": 7,
@@ -244,21 +244,21 @@
"a": 255
},
"rect": {
- "r_x0": 647.54,
- "r_y0": 352.3,
- "r_x1": 711.72,
- "r_y1": 352.3,
- "r_x2": 711.72,
- "r_y2": 338.59,
- "r_x3": 647.54,
- "r_y3": 338.59,
+ "r_x0": 515.0,
+ "r_y0": 376.0,
+ "r_x1": 468.0,
+ "r_y1": 376.0,
+ "r_x2": 468.0,
+ "r_y2": 392.0,
+ "r_x3": 515.0,
+ "r_y3": 392.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 8,
@@ -269,21 +269,21 @@
"a": 255
},
"rect": {
- "r_x0": 435.41,
- "r_y0": 352.3,
- "r_x1": 468.73,
- "r_y1": 352.3,
- "r_x2": 468.73,
- "r_y2": 338.59,
- "r_x3": 435.41,
- "r_y3": 338.59,
+ "r_x0": 545.0,
+ "r_y0": 328.0,
+ "r_x1": 442.33,
+ "r_y1": 328.0,
+ "r_x2": 442.33,
+ "r_y2": 344.0,
+ "r_x3": 545.0,
+ "r_y3": 344.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 9,
@@ -294,21 +294,21 @@
"a": 255
},
"rect": {
- "r_x0": 323.39,
- "r_y0": 352.3,
- "r_x1": 355.1,
- "r_y1": 352.3,
- "r_x2": 355.1,
- "r_y2": 338.59,
- "r_x3": 323.39,
- "r_y3": 338.59,
+ "r_x0": 515.0,
+ "r_y0": 296.67,
+ "r_x1": 468.0,
+ "r_y1": 296.67,
+ "r_x2": 468.0,
+ "r_y2": 312.67,
+ "r_x3": 515.0,
+ "r_y3": 312.67,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 10,
@@ -319,21 +319,21 @@
"a": 255
},
"rect": {
- "r_x0": 634.24,
- "r_y0": 279.18,
- "r_x1": 725.22,
- "r_y1": 279.18,
- "r_x2": 725.22,
- "r_y2": 265.46,
- "r_x3": 634.24,
- "r_y3": 265.46,
+ "r_x0": 385.67,
+ "r_y0": 490.33,
+ "r_x1": 274.0,
+ "r_y1": 490.33,
+ "r_x2": 274.0,
+ "r_y2": 506.33,
+ "r_x3": 385.67,
+ "r_y3": 506.33,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 11,
@@ -344,21 +344,21 @@
"a": 255
},
"rect": {
- "r_x0": 542.27,
- "r_y0": 279.18,
- "r_x1": 590.22,
- "r_y1": 279.18,
- "r_x2": 590.22,
- "r_y2": 265.46,
- "r_x3": 542.27,
- "r_y3": 265.46,
+ "r_x0": 363.0,
+ "r_y0": 459.0,
+ "r_x1": 292.67,
+ "r_y1": 459.0,
+ "r_x2": 292.67,
+ "r_y2": 475.0,
+ "r_x3": 363.0,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 12,
@@ -369,21 +369,96 @@
"a": 255
},
"rect": {
- "r_x0": 319.15,
- "r_y0": 279.18,
- "r_x1": 357.35,
- "r_y1": 279.18,
- "r_x2": 357.35,
- "r_y2": 265.46,
- "r_x3": 319.15,
- "r_y3": 265.46,
+ "r_x0": 383.67,
+ "r_y0": 408.0,
+ "r_x1": 278.0,
+ "r_y1": 408.0,
+ "r_x2": 278.0,
+ "r_y2": 424.0,
+ "r_x3": 383.67,
+ "r_y3": 424.0,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
+ },
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 351.33,
+ "r_y0": 376.0,
+ "r_x1": 304.33,
+ "r_y1": 376.0,
+ "r_x2": 304.33,
+ "r_y2": 392.0,
+ "r_x3": 351.33,
+ "r_y3": 392.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ },
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 383.67,
+ "r_y0": 328.0,
+ "r_x1": 278.0,
+ "r_y1": 328.0,
+ "r_x2": 278.0,
+ "r_y2": 344.0,
+ "r_x3": 383.67,
+ "r_y3": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ },
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 351.33,
+ "r_y0": 296.67,
+ "r_x1": 304.33,
+ "r_y1": 296.67,
+ "r_x2": 304.33,
+ "r_y2": 312.67,
+ "r_x3": 351.33,
+ "r_y3": 312.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"has_chars": false,
@@ -399,13 +474,13 @@
"id": 0,
"label": "table",
"bbox": {
- "l": 280.59,
- "t": 233.73,
- "r": 738.57,
- "b": 519.09,
+ "l": 240.9,
+ "t": 277.42,
+ "r": 722.95,
+ "b": 524.35,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.955,
+ "confidence": 0.979,
"cells": [
{
"index": 0,
@@ -416,21 +491,21 @@
"a": 255
},
"rect": {
- "r_x0": 534.41,
- "r_y0": 488.43,
- "r_x1": 596.97,
- "r_y1": 488.43,
- "r_x2": 596.97,
- "r_y2": 474.71,
- "r_x3": 534.41,
- "r_y3": 474.71,
+ "r_x0": 694.67,
+ "r_y0": 485.67,
+ "r_x1": 602.0,
+ "r_y1": 485.67,
+ "r_x2": 602.0,
+ "r_y2": 506.33,
+ "r_x3": 694.67,
+ "r_y3": 506.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
},
{
"index": 1,
@@ -441,21 +516,21 @@
"a": 255
},
"rect": {
- "r_x0": 420.78,
- "r_y0": 488.43,
- "r_x1": 483.35,
- "r_y1": 488.43,
- "r_x2": 483.35,
- "r_y2": 474.71,
- "r_x3": 420.78,
- "r_y3": 474.71,
+ "r_x0": 680.0,
+ "r_y0": 454.33,
+ "r_x1": 610.0,
+ "r_y1": 454.33,
+ "r_x2": 610.0,
+ "r_y2": 475.0,
+ "r_x3": 680.0,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
},
{
"index": 2,
@@ -466,21 +541,21 @@
"a": 255
},
"rect": {
- "r_x0": 307.16,
- "r_y0": 488.43,
- "r_x1": 369.73,
- "r_y1": 488.43,
- "r_x2": 369.73,
- "r_y2": 474.71,
- "r_x3": 307.16,
- "r_y3": 474.71,
+ "r_x0": 670.33,
+ "r_y0": 392.0,
+ "r_x1": 623.33,
+ "r_y1": 392.0,
+ "r_x2": 623.33,
+ "r_y2": 408.0,
+ "r_x3": 670.33,
+ "r_y3": 408.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 3,
@@ -491,21 +566,21 @@
"a": 255
},
"rect": {
- "r_x0": 641.33,
- "r_y0": 420.93,
- "r_x1": 718.47,
- "r_y1": 420.93,
- "r_x2": 718.47,
- "r_y2": 407.21,
- "r_x3": 641.33,
- "r_y3": 407.21,
+ "r_x0": 670.33,
+ "r_y0": 312.0,
+ "r_x1": 623.33,
+ "r_y1": 312.0,
+ "r_x2": 623.33,
+ "r_y2": 328.0,
+ "r_x3": 670.33,
+ "r_y3": 328.0,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 4,
@@ -516,21 +591,21 @@
"a": 255
},
"rect": {
- "r_x0": 531.29,
- "r_y0": 420.93,
- "r_x1": 600.35,
- "r_y1": 420.93,
- "r_x2": 600.35,
- "r_y2": 407.21,
- "r_x3": 531.29,
- "r_y3": 407.21,
+ "r_x0": 559.67,
+ "r_y0": 485.67,
+ "r_x1": 428.33,
+ "r_y1": 485.67,
+ "r_x2": 428.33,
+ "r_y2": 506.33,
+ "r_x3": 559.67,
+ "r_y3": 506.33,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 5,
@@ -541,21 +616,21 @@
"a": 255
},
"rect": {
- "r_x0": 410.9,
- "r_y0": 420.93,
- "r_x1": 494.6,
- "r_y1": 420.93,
- "r_x2": 494.6,
- "r_y2": 407.21,
- "r_x3": 410.9,
- "r_y3": 407.21,
+ "r_x0": 526.67,
+ "r_y0": 459.0,
+ "r_x1": 456.0,
+ "r_y1": 459.0,
+ "r_x2": 456.0,
+ "r_y2": 475.0,
+ "r_x3": 526.67,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 6,
@@ -566,21 +641,21 @@
"a": 255
},
"rect": {
- "r_x0": 326.21,
- "r_y0": 420.93,
- "r_x1": 350.6,
- "r_y1": 420.93,
- "r_x2": 350.6,
- "r_y2": 407.21,
- "r_x3": 326.21,
- "r_y3": 407.21,
+ "r_x0": 545.0,
+ "r_y0": 408.0,
+ "r_x1": 442.33,
+ "r_y1": 408.0,
+ "r_x2": 442.33,
+ "r_y2": 424.0,
+ "r_x3": 545.0,
+ "r_y3": 424.0,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 91.0,
+ "from_ocr": true
},
{
"index": 7,
@@ -591,21 +666,21 @@
"a": 255
},
"rect": {
- "r_x0": 647.54,
- "r_y0": 352.3,
- "r_x1": 711.72,
- "r_y1": 352.3,
- "r_x2": 711.72,
- "r_y2": 338.59,
- "r_x3": 647.54,
- "r_y3": 338.59,
+ "r_x0": 515.0,
+ "r_y0": 376.0,
+ "r_x1": 468.0,
+ "r_y1": 376.0,
+ "r_x2": 468.0,
+ "r_y2": 392.0,
+ "r_x3": 515.0,
+ "r_y3": 392.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 8,
@@ -616,21 +691,21 @@
"a": 255
},
"rect": {
- "r_x0": 435.41,
- "r_y0": 352.3,
- "r_x1": 468.73,
- "r_y1": 352.3,
- "r_x2": 468.73,
- "r_y2": 338.59,
- "r_x3": 435.41,
- "r_y3": 338.59,
+ "r_x0": 545.0,
+ "r_y0": 328.0,
+ "r_x1": 442.33,
+ "r_y1": 328.0,
+ "r_x2": 442.33,
+ "r_y2": 344.0,
+ "r_x3": 545.0,
+ "r_y3": 344.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 9,
@@ -641,21 +716,21 @@
"a": 255
},
"rect": {
- "r_x0": 323.39,
- "r_y0": 352.3,
- "r_x1": 355.1,
- "r_y1": 352.3,
- "r_x2": 355.1,
- "r_y2": 338.59,
- "r_x3": 323.39,
- "r_y3": 338.59,
+ "r_x0": 515.0,
+ "r_y0": 296.67,
+ "r_x1": 468.0,
+ "r_y1": 296.67,
+ "r_x2": 468.0,
+ "r_y2": 312.67,
+ "r_x3": 515.0,
+ "r_y3": 312.67,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 10,
@@ -666,21 +741,21 @@
"a": 255
},
"rect": {
- "r_x0": 634.24,
- "r_y0": 279.18,
- "r_x1": 725.22,
- "r_y1": 279.18,
- "r_x2": 725.22,
- "r_y2": 265.46,
- "r_x3": 634.24,
- "r_y3": 265.46,
+ "r_x0": 385.67,
+ "r_y0": 490.33,
+ "r_x1": 274.0,
+ "r_y1": 490.33,
+ "r_x2": 274.0,
+ "r_y2": 506.33,
+ "r_x3": 385.67,
+ "r_y3": 506.33,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 11,
@@ -691,21 +766,21 @@
"a": 255
},
"rect": {
- "r_x0": 542.27,
- "r_y0": 279.18,
- "r_x1": 590.22,
- "r_y1": 279.18,
- "r_x2": 590.22,
- "r_y2": 265.46,
- "r_x3": 542.27,
- "r_y3": 265.46,
+ "r_x0": 363.0,
+ "r_y0": 459.0,
+ "r_x1": 292.67,
+ "r_y1": 459.0,
+ "r_x2": 292.67,
+ "r_y2": 475.0,
+ "r_x3": 363.0,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 12,
@@ -716,35 +791,110 @@
"a": 255
},
"rect": {
- "r_x0": 319.15,
- "r_y0": 279.18,
- "r_x1": 357.35,
- "r_y1": 279.18,
- "r_x2": 357.35,
- "r_y2": 265.46,
- "r_x3": 319.15,
- "r_y3": 265.46,
+ "r_x0": 383.67,
+ "r_y0": 408.0,
+ "r_x1": 278.0,
+ "r_y1": 408.0,
+ "r_x2": 278.0,
+ "r_y2": 424.0,
+ "r_x3": 383.67,
+ "r_y3": 424.0,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
+ },
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 351.33,
+ "r_y0": 376.0,
+ "r_x1": 304.33,
+ "r_y1": 376.0,
+ "r_x2": 304.33,
+ "r_y2": 392.0,
+ "r_x3": 351.33,
+ "r_y3": 392.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ },
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 383.67,
+ "r_y0": 328.0,
+ "r_x1": 278.0,
+ "r_y1": 328.0,
+ "r_x2": 278.0,
+ "r_y2": 344.0,
+ "r_x3": 383.67,
+ "r_y3": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ },
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 351.33,
+ "r_y0": 296.67,
+ "r_x1": 304.33,
+ "r_y1": 296.67,
+ "r_x2": 304.33,
+ "r_y2": 312.67,
+ "r_x3": 351.33,
+ "r_y3": 312.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": [
{
- "id": 16,
+ "id": 1,
"label": "text",
"bbox": {
- "l": 534.41,
- "t": 474.71,
- "r": 596.97,
- "b": 488.43,
+ "l": 602.0,
+ "t": 485.67,
+ "r": 694.67,
+ "b": 506.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 90.0,
"cells": [
{
"index": 0,
@@ -755,36 +905,36 @@
"a": 255
},
"rect": {
- "r_x0": 534.41,
- "r_y0": 488.43,
- "r_x1": 596.97,
- "r_y1": 488.43,
- "r_x2": 596.97,
- "r_y2": 474.71,
- "r_x3": 534.41,
- "r_y3": 474.71,
+ "r_x0": 694.67,
+ "r_y0": 485.67,
+ "r_x1": 602.0,
+ "r_y1": 485.67,
+ "r_x2": 602.0,
+ "r_y2": 506.33,
+ "r_x3": 694.67,
+ "r_y3": 506.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 17,
+ "id": 2,
"label": "text",
"bbox": {
- "l": 420.78,
- "t": 474.71,
- "r": 483.35,
- "b": 488.43,
+ "l": 610.0,
+ "t": 454.33,
+ "r": 680.0,
+ "b": 475.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 90.0,
"cells": [
{
"index": 1,
@@ -795,36 +945,36 @@
"a": 255
},
"rect": {
- "r_x0": 420.78,
- "r_y0": 488.43,
- "r_x1": 483.35,
- "r_y1": 488.43,
- "r_x2": 483.35,
- "r_y2": 474.71,
- "r_x3": 420.78,
- "r_y3": 474.71,
+ "r_x0": 680.0,
+ "r_y0": 454.33,
+ "r_x1": 610.0,
+ "r_y1": 454.33,
+ "r_x2": 610.0,
+ "r_y2": 475.0,
+ "r_x3": 680.0,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 18,
+ "id": 3,
"label": "text",
"bbox": {
- "l": 307.16,
- "t": 474.71,
- "r": 369.73,
- "b": 488.43,
+ "l": 623.33,
+ "t": 392.0,
+ "r": 670.33,
+ "b": 408.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 2,
@@ -835,36 +985,36 @@
"a": 255
},
"rect": {
- "r_x0": 307.16,
- "r_y0": 488.43,
- "r_x1": 369.73,
- "r_y1": 488.43,
- "r_x2": 369.73,
- "r_y2": 474.71,
- "r_x3": 307.16,
- "r_y3": 474.71,
+ "r_x0": 670.33,
+ "r_y0": 392.0,
+ "r_x1": 623.33,
+ "r_y1": 392.0,
+ "r_x2": 623.33,
+ "r_y2": 408.0,
+ "r_x3": 670.33,
+ "r_y3": 408.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 19,
+ "id": 4,
"label": "text",
"bbox": {
- "l": 641.33,
- "t": 407.21,
- "r": 718.47,
- "b": 420.93,
+ "l": 623.33,
+ "t": 312.0,
+ "r": 670.33,
+ "b": 328.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 3,
@@ -875,36 +1025,36 @@
"a": 255
},
"rect": {
- "r_x0": 641.33,
- "r_y0": 420.93,
- "r_x1": 718.47,
- "r_y1": 420.93,
- "r_x2": 718.47,
- "r_y2": 407.21,
- "r_x3": 641.33,
- "r_y3": 407.21,
+ "r_x0": 670.33,
+ "r_y0": 312.0,
+ "r_x1": 623.33,
+ "r_y1": 312.0,
+ "r_x2": 623.33,
+ "r_y2": 328.0,
+ "r_x3": 670.33,
+ "r_y3": 328.0,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 20,
+ "id": 5,
"label": "text",
"bbox": {
- "l": 531.29,
- "t": 407.21,
- "r": 600.35,
- "b": 420.93,
+ "l": 428.33,
+ "t": 485.67,
+ "r": 559.67,
+ "b": 506.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 92.0,
"cells": [
{
"index": 4,
@@ -915,36 +1065,36 @@
"a": 255
},
"rect": {
- "r_x0": 531.29,
- "r_y0": 420.93,
- "r_x1": 600.35,
- "r_y1": 420.93,
- "r_x2": 600.35,
- "r_y2": 407.21,
- "r_x3": 531.29,
- "r_y3": 407.21,
+ "r_x0": 559.67,
+ "r_y0": 485.67,
+ "r_x1": 428.33,
+ "r_y1": 485.67,
+ "r_x2": 428.33,
+ "r_y2": 506.33,
+ "r_x3": 559.67,
+ "r_y3": 506.33,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 21,
+ "id": 6,
"label": "text",
"bbox": {
- "l": 410.9,
- "t": 407.21,
- "r": 494.6,
- "b": 420.93,
+ "l": 456.0,
+ "t": 459.0,
+ "r": 526.67,
+ "b": 475.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 5,
@@ -955,36 +1105,36 @@
"a": 255
},
"rect": {
- "r_x0": 410.9,
- "r_y0": 420.93,
- "r_x1": 494.6,
- "r_y1": 420.93,
- "r_x2": 494.6,
- "r_y2": 407.21,
- "r_x3": 410.9,
- "r_y3": 407.21,
+ "r_x0": 526.67,
+ "r_y0": 459.0,
+ "r_x1": 456.0,
+ "r_y1": 459.0,
+ "r_x2": 456.0,
+ "r_y2": 475.0,
+ "r_x3": 526.67,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 22,
+ "id": 7,
"label": "text",
"bbox": {
- "l": 326.21,
- "t": 407.21,
- "r": 350.6,
- "b": 420.93,
+ "l": 442.33,
+ "t": 408.0,
+ "r": 545.0,
+ "b": 424.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 91.0,
"cells": [
{
"index": 6,
@@ -995,36 +1145,36 @@
"a": 255
},
"rect": {
- "r_x0": 326.21,
- "r_y0": 420.93,
- "r_x1": 350.6,
- "r_y1": 420.93,
- "r_x2": 350.6,
- "r_y2": 407.21,
- "r_x3": 326.21,
- "r_y3": 407.21,
+ "r_x0": 545.0,
+ "r_y0": 408.0,
+ "r_x1": 442.33,
+ "r_y1": 408.0,
+ "r_x2": 442.33,
+ "r_y2": 424.0,
+ "r_x3": 545.0,
+ "r_y3": 424.0,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 91.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 23,
+ "id": 8,
"label": "text",
"bbox": {
- "l": 647.54,
- "t": 338.59,
- "r": 711.72,
- "b": 352.3,
+ "l": 468.0,
+ "t": 376.0,
+ "r": 515.0,
+ "b": 392.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 7,
@@ -1035,36 +1185,36 @@
"a": 255
},
"rect": {
- "r_x0": 647.54,
- "r_y0": 352.3,
- "r_x1": 711.72,
- "r_y1": 352.3,
- "r_x2": 711.72,
- "r_y2": 338.59,
- "r_x3": 647.54,
- "r_y3": 338.59,
+ "r_x0": 515.0,
+ "r_y0": 376.0,
+ "r_x1": 468.0,
+ "r_y1": 376.0,
+ "r_x2": 468.0,
+ "r_y2": 392.0,
+ "r_x3": 515.0,
+ "r_y3": 392.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 24,
+ "id": 9,
"label": "text",
"bbox": {
- "l": 435.41,
- "t": 338.59,
- "r": 468.73,
- "b": 352.3,
+ "l": 442.33,
+ "t": 328.0,
+ "r": 545.0,
+ "b": 344.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 8,
@@ -1075,36 +1225,36 @@
"a": 255
},
"rect": {
- "r_x0": 435.41,
- "r_y0": 352.3,
- "r_x1": 468.73,
- "r_y1": 352.3,
- "r_x2": 468.73,
- "r_y2": 338.59,
- "r_x3": 435.41,
- "r_y3": 338.59,
+ "r_x0": 545.0,
+ "r_y0": 328.0,
+ "r_x1": 442.33,
+ "r_y1": 328.0,
+ "r_x2": 442.33,
+ "r_y2": 344.0,
+ "r_x3": 545.0,
+ "r_y3": 344.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 25,
+ "id": 10,
"label": "text",
"bbox": {
- "l": 323.39,
- "t": 338.59,
- "r": 355.1,
- "b": 352.3,
+ "l": 468.0,
+ "t": 296.67,
+ "r": 515.0,
+ "b": 312.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 9,
@@ -1115,36 +1265,36 @@
"a": 255
},
"rect": {
- "r_x0": 323.39,
- "r_y0": 352.3,
- "r_x1": 355.1,
- "r_y1": 352.3,
- "r_x2": 355.1,
- "r_y2": 338.59,
- "r_x3": 323.39,
- "r_y3": 338.59,
+ "r_x0": 515.0,
+ "r_y0": 296.67,
+ "r_x1": 468.0,
+ "r_y1": 296.67,
+ "r_x2": 468.0,
+ "r_y2": 312.67,
+ "r_x3": 515.0,
+ "r_y3": 312.67,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 26,
+ "id": 11,
"label": "text",
"bbox": {
- "l": 634.24,
- "t": 265.46,
- "r": 725.22,
- "b": 279.18,
+ "l": 274.0,
+ "t": 490.33,
+ "r": 385.67,
+ "b": 506.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 10,
@@ -1155,36 +1305,36 @@
"a": 255
},
"rect": {
- "r_x0": 634.24,
- "r_y0": 279.18,
- "r_x1": 725.22,
- "r_y1": 279.18,
- "r_x2": 725.22,
- "r_y2": 265.46,
- "r_x3": 634.24,
- "r_y3": 265.46,
+ "r_x0": 385.67,
+ "r_y0": 490.33,
+ "r_x1": 274.0,
+ "r_y1": 490.33,
+ "r_x2": 274.0,
+ "r_y2": 506.33,
+ "r_x3": 385.67,
+ "r_y3": 506.33,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 27,
+ "id": 12,
"label": "text",
"bbox": {
- "l": 542.27,
- "t": 265.46,
- "r": 590.22,
- "b": 279.18,
+ "l": 292.67,
+ "t": 459.0,
+ "r": 363.0,
+ "b": 475.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 11,
@@ -1195,36 +1345,36 @@
"a": 255
},
"rect": {
- "r_x0": 542.27,
- "r_y0": 279.18,
- "r_x1": 590.22,
- "r_y1": 279.18,
- "r_x2": 590.22,
- "r_y2": 265.46,
- "r_x3": 542.27,
- "r_y3": 265.46,
+ "r_x0": 363.0,
+ "r_y0": 459.0,
+ "r_x1": 292.67,
+ "r_y1": 459.0,
+ "r_x2": 292.67,
+ "r_y2": 475.0,
+ "r_x3": 363.0,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 28,
+ "id": 13,
"label": "text",
"bbox": {
- "l": 319.15,
- "t": 265.46,
- "r": 357.35,
- "b": 279.18,
+ "l": 278.0,
+ "t": 408.0,
+ "r": 383.67,
+ "b": 424.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 12,
@@ -1235,21 +1385,141 @@
"a": 255
},
"rect": {
- "r_x0": 319.15,
- "r_y0": 279.18,
- "r_x1": 357.35,
- "r_y1": 279.18,
- "r_x2": 357.35,
- "r_y2": 265.46,
- "r_x3": 319.15,
- "r_y3": 265.46,
+ "r_x0": 383.67,
+ "r_y0": 408.0,
+ "r_x1": 278.0,
+ "r_y1": 408.0,
+ "r_x2": 278.0,
+ "r_y2": 424.0,
+ "r_x3": 383.67,
+ "r_y3": 424.0,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 14,
+ "label": "text",
+ "bbox": {
+ "l": 304.33,
+ "t": 376.0,
+ "r": 351.33,
+ "b": 392.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 351.33,
+ "r_y0": 376.0,
+ "r_x1": 304.33,
+ "r_y1": 376.0,
+ "r_x2": 304.33,
+ "r_y2": 392.0,
+ "r_x3": 351.33,
+ "r_y3": 392.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 15,
+ "label": "text",
+ "bbox": {
+ "l": 278.0,
+ "t": 328.0,
+ "r": 383.67,
+ "b": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 383.67,
+ "r_y0": 328.0,
+ "r_x1": 278.0,
+ "r_y1": 328.0,
+ "r_x2": 278.0,
+ "r_y2": 344.0,
+ "r_x3": 383.67,
+ "r_y3": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 16,
+ "label": "text",
+ "bbox": {
+ "l": 304.33,
+ "t": 296.67,
+ "r": 351.33,
+ "b": 312.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 351.33,
+ "r_y0": 296.67,
+ "r_x1": 304.33,
+ "r_y1": 296.67,
+ "r_x2": 304.33,
+ "r_y2": 312.67,
+ "r_x3": 351.33,
+ "r_y3": 312.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
@@ -1268,13 +1538,13 @@
"id": 0,
"label": "table",
"bbox": {
- "l": 280.59,
- "t": 233.73,
- "r": 738.57,
- "b": 519.09,
+ "l": 240.9,
+ "t": 277.42,
+ "r": 722.95,
+ "b": 524.35,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.955,
+ "confidence": 0.979,
"cells": [
{
"index": 0,
@@ -1285,21 +1555,21 @@
"a": 255
},
"rect": {
- "r_x0": 534.41,
- "r_y0": 488.43,
- "r_x1": 596.97,
- "r_y1": 488.43,
- "r_x2": 596.97,
- "r_y2": 474.71,
- "r_x3": 534.41,
- "r_y3": 474.71,
+ "r_x0": 694.67,
+ "r_y0": 485.67,
+ "r_x1": 602.0,
+ "r_y1": 485.67,
+ "r_x2": 602.0,
+ "r_y2": 506.33,
+ "r_x3": 694.67,
+ "r_y3": 506.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
},
{
"index": 1,
@@ -1310,21 +1580,21 @@
"a": 255
},
"rect": {
- "r_x0": 420.78,
- "r_y0": 488.43,
- "r_x1": 483.35,
- "r_y1": 488.43,
- "r_x2": 483.35,
- "r_y2": 474.71,
- "r_x3": 420.78,
- "r_y3": 474.71,
+ "r_x0": 680.0,
+ "r_y0": 454.33,
+ "r_x1": 610.0,
+ "r_y1": 454.33,
+ "r_x2": 610.0,
+ "r_y2": 475.0,
+ "r_x3": 680.0,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
},
{
"index": 2,
@@ -1335,21 +1605,21 @@
"a": 255
},
"rect": {
- "r_x0": 307.16,
- "r_y0": 488.43,
- "r_x1": 369.73,
- "r_y1": 488.43,
- "r_x2": 369.73,
- "r_y2": 474.71,
- "r_x3": 307.16,
- "r_y3": 474.71,
+ "r_x0": 670.33,
+ "r_y0": 392.0,
+ "r_x1": 623.33,
+ "r_y1": 392.0,
+ "r_x2": 623.33,
+ "r_y2": 408.0,
+ "r_x3": 670.33,
+ "r_y3": 408.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 3,
@@ -1360,21 +1630,21 @@
"a": 255
},
"rect": {
- "r_x0": 641.33,
- "r_y0": 420.93,
- "r_x1": 718.47,
- "r_y1": 420.93,
- "r_x2": 718.47,
- "r_y2": 407.21,
- "r_x3": 641.33,
- "r_y3": 407.21,
+ "r_x0": 670.33,
+ "r_y0": 312.0,
+ "r_x1": 623.33,
+ "r_y1": 312.0,
+ "r_x2": 623.33,
+ "r_y2": 328.0,
+ "r_x3": 670.33,
+ "r_y3": 328.0,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 4,
@@ -1385,21 +1655,21 @@
"a": 255
},
"rect": {
- "r_x0": 531.29,
- "r_y0": 420.93,
- "r_x1": 600.35,
- "r_y1": 420.93,
- "r_x2": 600.35,
- "r_y2": 407.21,
- "r_x3": 531.29,
- "r_y3": 407.21,
+ "r_x0": 559.67,
+ "r_y0": 485.67,
+ "r_x1": 428.33,
+ "r_y1": 485.67,
+ "r_x2": 428.33,
+ "r_y2": 506.33,
+ "r_x3": 559.67,
+ "r_y3": 506.33,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 5,
@@ -1410,21 +1680,21 @@
"a": 255
},
"rect": {
- "r_x0": 410.9,
- "r_y0": 420.93,
- "r_x1": 494.6,
- "r_y1": 420.93,
- "r_x2": 494.6,
- "r_y2": 407.21,
- "r_x3": 410.9,
- "r_y3": 407.21,
+ "r_x0": 526.67,
+ "r_y0": 459.0,
+ "r_x1": 456.0,
+ "r_y1": 459.0,
+ "r_x2": 456.0,
+ "r_y2": 475.0,
+ "r_x3": 526.67,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 6,
@@ -1435,21 +1705,21 @@
"a": 255
},
"rect": {
- "r_x0": 326.21,
- "r_y0": 420.93,
- "r_x1": 350.6,
- "r_y1": 420.93,
- "r_x2": 350.6,
- "r_y2": 407.21,
- "r_x3": 326.21,
- "r_y3": 407.21,
+ "r_x0": 545.0,
+ "r_y0": 408.0,
+ "r_x1": 442.33,
+ "r_y1": 408.0,
+ "r_x2": 442.33,
+ "r_y2": 424.0,
+ "r_x3": 545.0,
+ "r_y3": 424.0,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 91.0,
+ "from_ocr": true
},
{
"index": 7,
@@ -1460,21 +1730,21 @@
"a": 255
},
"rect": {
- "r_x0": 647.54,
- "r_y0": 352.3,
- "r_x1": 711.72,
- "r_y1": 352.3,
- "r_x2": 711.72,
- "r_y2": 338.59,
- "r_x3": 647.54,
- "r_y3": 338.59,
+ "r_x0": 515.0,
+ "r_y0": 376.0,
+ "r_x1": 468.0,
+ "r_y1": 376.0,
+ "r_x2": 468.0,
+ "r_y2": 392.0,
+ "r_x3": 515.0,
+ "r_y3": 392.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 8,
@@ -1485,21 +1755,21 @@
"a": 255
},
"rect": {
- "r_x0": 435.41,
- "r_y0": 352.3,
- "r_x1": 468.73,
- "r_y1": 352.3,
- "r_x2": 468.73,
- "r_y2": 338.59,
- "r_x3": 435.41,
- "r_y3": 338.59,
+ "r_x0": 545.0,
+ "r_y0": 328.0,
+ "r_x1": 442.33,
+ "r_y1": 328.0,
+ "r_x2": 442.33,
+ "r_y2": 344.0,
+ "r_x3": 545.0,
+ "r_y3": 344.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 9,
@@ -1510,21 +1780,21 @@
"a": 255
},
"rect": {
- "r_x0": 323.39,
- "r_y0": 352.3,
- "r_x1": 355.1,
- "r_y1": 352.3,
- "r_x2": 355.1,
- "r_y2": 338.59,
- "r_x3": 323.39,
- "r_y3": 338.59,
+ "r_x0": 515.0,
+ "r_y0": 296.67,
+ "r_x1": 468.0,
+ "r_y1": 296.67,
+ "r_x2": 468.0,
+ "r_y2": 312.67,
+ "r_x3": 515.0,
+ "r_y3": 312.67,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 10,
@@ -1535,21 +1805,21 @@
"a": 255
},
"rect": {
- "r_x0": 634.24,
- "r_y0": 279.18,
- "r_x1": 725.22,
- "r_y1": 279.18,
- "r_x2": 725.22,
- "r_y2": 265.46,
- "r_x3": 634.24,
- "r_y3": 265.46,
+ "r_x0": 385.67,
+ "r_y0": 490.33,
+ "r_x1": 274.0,
+ "r_y1": 490.33,
+ "r_x2": 274.0,
+ "r_y2": 506.33,
+ "r_x3": 385.67,
+ "r_y3": 506.33,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 11,
@@ -1560,21 +1830,21 @@
"a": 255
},
"rect": {
- "r_x0": 542.27,
- "r_y0": 279.18,
- "r_x1": 590.22,
- "r_y1": 279.18,
- "r_x2": 590.22,
- "r_y2": 265.46,
- "r_x3": 542.27,
- "r_y3": 265.46,
+ "r_x0": 363.0,
+ "r_y0": 459.0,
+ "r_x1": 292.67,
+ "r_y1": 459.0,
+ "r_x2": 292.67,
+ "r_y2": 475.0,
+ "r_x3": 363.0,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 12,
@@ -1585,35 +1855,110 @@
"a": 255
},
"rect": {
- "r_x0": 319.15,
- "r_y0": 279.18,
- "r_x1": 357.35,
- "r_y1": 279.18,
- "r_x2": 357.35,
- "r_y2": 265.46,
- "r_x3": 319.15,
- "r_y3": 265.46,
+ "r_x0": 383.67,
+ "r_y0": 408.0,
+ "r_x1": 278.0,
+ "r_y1": 408.0,
+ "r_x2": 278.0,
+ "r_y2": 424.0,
+ "r_x3": 383.67,
+ "r_y3": 424.0,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
+ },
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 351.33,
+ "r_y0": 376.0,
+ "r_x1": 304.33,
+ "r_y1": 376.0,
+ "r_x2": 304.33,
+ "r_y2": 392.0,
+ "r_x3": 351.33,
+ "r_y3": 392.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ },
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 383.67,
+ "r_y0": 328.0,
+ "r_x1": 278.0,
+ "r_y1": 328.0,
+ "r_x2": 278.0,
+ "r_y2": 344.0,
+ "r_x3": 383.67,
+ "r_y3": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ },
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 351.33,
+ "r_y0": 296.67,
+ "r_x1": 304.33,
+ "r_y1": 296.67,
+ "r_x2": 304.33,
+ "r_y2": 312.67,
+ "r_x3": 351.33,
+ "r_y3": 312.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": [
{
- "id": 16,
+ "id": 1,
"label": "text",
"bbox": {
- "l": 534.41,
- "t": 474.71,
- "r": 596.97,
- "b": 488.43,
+ "l": 602.0,
+ "t": 485.67,
+ "r": 694.67,
+ "b": 506.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 90.0,
"cells": [
{
"index": 0,
@@ -1624,36 +1969,36 @@
"a": 255
},
"rect": {
- "r_x0": 534.41,
- "r_y0": 488.43,
- "r_x1": 596.97,
- "r_y1": 488.43,
- "r_x2": 596.97,
- "r_y2": 474.71,
- "r_x3": 534.41,
- "r_y3": 474.71,
+ "r_x0": 694.67,
+ "r_y0": 485.67,
+ "r_x1": 602.0,
+ "r_y1": 485.67,
+ "r_x2": 602.0,
+ "r_y2": 506.33,
+ "r_x3": 694.67,
+ "r_y3": 506.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 17,
+ "id": 2,
"label": "text",
"bbox": {
- "l": 420.78,
- "t": 474.71,
- "r": 483.35,
- "b": 488.43,
+ "l": 610.0,
+ "t": 454.33,
+ "r": 680.0,
+ "b": 475.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 90.0,
"cells": [
{
"index": 1,
@@ -1664,36 +2009,36 @@
"a": 255
},
"rect": {
- "r_x0": 420.78,
- "r_y0": 488.43,
- "r_x1": 483.35,
- "r_y1": 488.43,
- "r_x2": 483.35,
- "r_y2": 474.71,
- "r_x3": 420.78,
- "r_y3": 474.71,
+ "r_x0": 680.0,
+ "r_y0": 454.33,
+ "r_x1": 610.0,
+ "r_y1": 454.33,
+ "r_x2": 610.0,
+ "r_y2": 475.0,
+ "r_x3": 680.0,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 18,
+ "id": 3,
"label": "text",
"bbox": {
- "l": 307.16,
- "t": 474.71,
- "r": 369.73,
- "b": 488.43,
+ "l": 623.33,
+ "t": 392.0,
+ "r": 670.33,
+ "b": 408.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 2,
@@ -1704,36 +2049,36 @@
"a": 255
},
"rect": {
- "r_x0": 307.16,
- "r_y0": 488.43,
- "r_x1": 369.73,
- "r_y1": 488.43,
- "r_x2": 369.73,
- "r_y2": 474.71,
- "r_x3": 307.16,
- "r_y3": 474.71,
+ "r_x0": 670.33,
+ "r_y0": 392.0,
+ "r_x1": 623.33,
+ "r_y1": 392.0,
+ "r_x2": 623.33,
+ "r_y2": 408.0,
+ "r_x3": 670.33,
+ "r_y3": 408.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 19,
+ "id": 4,
"label": "text",
"bbox": {
- "l": 641.33,
- "t": 407.21,
- "r": 718.47,
- "b": 420.93,
+ "l": 623.33,
+ "t": 312.0,
+ "r": 670.33,
+ "b": 328.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 3,
@@ -1744,36 +2089,36 @@
"a": 255
},
"rect": {
- "r_x0": 641.33,
- "r_y0": 420.93,
- "r_x1": 718.47,
- "r_y1": 420.93,
- "r_x2": 718.47,
- "r_y2": 407.21,
- "r_x3": 641.33,
- "r_y3": 407.21,
+ "r_x0": 670.33,
+ "r_y0": 312.0,
+ "r_x1": 623.33,
+ "r_y1": 312.0,
+ "r_x2": 623.33,
+ "r_y2": 328.0,
+ "r_x3": 670.33,
+ "r_y3": 328.0,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 20,
+ "id": 5,
"label": "text",
"bbox": {
- "l": 531.29,
- "t": 407.21,
- "r": 600.35,
- "b": 420.93,
+ "l": 428.33,
+ "t": 485.67,
+ "r": 559.67,
+ "b": 506.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 92.0,
"cells": [
{
"index": 4,
@@ -1784,36 +2129,36 @@
"a": 255
},
"rect": {
- "r_x0": 531.29,
- "r_y0": 420.93,
- "r_x1": 600.35,
- "r_y1": 420.93,
- "r_x2": 600.35,
- "r_y2": 407.21,
- "r_x3": 531.29,
- "r_y3": 407.21,
+ "r_x0": 559.67,
+ "r_y0": 485.67,
+ "r_x1": 428.33,
+ "r_y1": 485.67,
+ "r_x2": 428.33,
+ "r_y2": 506.33,
+ "r_x3": 559.67,
+ "r_y3": 506.33,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 21,
+ "id": 6,
"label": "text",
"bbox": {
- "l": 410.9,
- "t": 407.21,
- "r": 494.6,
- "b": 420.93,
+ "l": 456.0,
+ "t": 459.0,
+ "r": 526.67,
+ "b": 475.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 5,
@@ -1824,36 +2169,36 @@
"a": 255
},
"rect": {
- "r_x0": 410.9,
- "r_y0": 420.93,
- "r_x1": 494.6,
- "r_y1": 420.93,
- "r_x2": 494.6,
- "r_y2": 407.21,
- "r_x3": 410.9,
- "r_y3": 407.21,
+ "r_x0": 526.67,
+ "r_y0": 459.0,
+ "r_x1": 456.0,
+ "r_y1": 459.0,
+ "r_x2": 456.0,
+ "r_y2": 475.0,
+ "r_x3": 526.67,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 22,
+ "id": 7,
"label": "text",
"bbox": {
- "l": 326.21,
- "t": 407.21,
- "r": 350.6,
- "b": 420.93,
+ "l": 442.33,
+ "t": 408.0,
+ "r": 545.0,
+ "b": 424.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 91.0,
"cells": [
{
"index": 6,
@@ -1864,36 +2209,36 @@
"a": 255
},
"rect": {
- "r_x0": 326.21,
- "r_y0": 420.93,
- "r_x1": 350.6,
- "r_y1": 420.93,
- "r_x2": 350.6,
- "r_y2": 407.21,
- "r_x3": 326.21,
- "r_y3": 407.21,
+ "r_x0": 545.0,
+ "r_y0": 408.0,
+ "r_x1": 442.33,
+ "r_y1": 408.0,
+ "r_x2": 442.33,
+ "r_y2": 424.0,
+ "r_x3": 545.0,
+ "r_y3": 424.0,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 91.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 23,
+ "id": 8,
"label": "text",
"bbox": {
- "l": 647.54,
- "t": 338.59,
- "r": 711.72,
- "b": 352.3,
+ "l": 468.0,
+ "t": 376.0,
+ "r": 515.0,
+ "b": 392.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 7,
@@ -1904,36 +2249,36 @@
"a": 255
},
"rect": {
- "r_x0": 647.54,
- "r_y0": 352.3,
- "r_x1": 711.72,
- "r_y1": 352.3,
- "r_x2": 711.72,
- "r_y2": 338.59,
- "r_x3": 647.54,
- "r_y3": 338.59,
+ "r_x0": 515.0,
+ "r_y0": 376.0,
+ "r_x1": 468.0,
+ "r_y1": 376.0,
+ "r_x2": 468.0,
+ "r_y2": 392.0,
+ "r_x3": 515.0,
+ "r_y3": 392.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 24,
+ "id": 9,
"label": "text",
"bbox": {
- "l": 435.41,
- "t": 338.59,
- "r": 468.73,
- "b": 352.3,
+ "l": 442.33,
+ "t": 328.0,
+ "r": 545.0,
+ "b": 344.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 8,
@@ -1944,36 +2289,36 @@
"a": 255
},
"rect": {
- "r_x0": 435.41,
- "r_y0": 352.3,
- "r_x1": 468.73,
- "r_y1": 352.3,
- "r_x2": 468.73,
- "r_y2": 338.59,
- "r_x3": 435.41,
- "r_y3": 338.59,
+ "r_x0": 545.0,
+ "r_y0": 328.0,
+ "r_x1": 442.33,
+ "r_y1": 328.0,
+ "r_x2": 442.33,
+ "r_y2": 344.0,
+ "r_x3": 545.0,
+ "r_y3": 344.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 25,
+ "id": 10,
"label": "text",
"bbox": {
- "l": 323.39,
- "t": 338.59,
- "r": 355.1,
- "b": 352.3,
+ "l": 468.0,
+ "t": 296.67,
+ "r": 515.0,
+ "b": 312.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 9,
@@ -1984,36 +2329,36 @@
"a": 255
},
"rect": {
- "r_x0": 323.39,
- "r_y0": 352.3,
- "r_x1": 355.1,
- "r_y1": 352.3,
- "r_x2": 355.1,
- "r_y2": 338.59,
- "r_x3": 323.39,
- "r_y3": 338.59,
+ "r_x0": 515.0,
+ "r_y0": 296.67,
+ "r_x1": 468.0,
+ "r_y1": 296.67,
+ "r_x2": 468.0,
+ "r_y2": 312.67,
+ "r_x3": 515.0,
+ "r_y3": 312.67,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 26,
+ "id": 11,
"label": "text",
"bbox": {
- "l": 634.24,
- "t": 265.46,
- "r": 725.22,
- "b": 279.18,
+ "l": 274.0,
+ "t": 490.33,
+ "r": 385.67,
+ "b": 506.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 10,
@@ -2024,36 +2369,36 @@
"a": 255
},
"rect": {
- "r_x0": 634.24,
- "r_y0": 279.18,
- "r_x1": 725.22,
- "r_y1": 279.18,
- "r_x2": 725.22,
- "r_y2": 265.46,
- "r_x3": 634.24,
- "r_y3": 265.46,
+ "r_x0": 385.67,
+ "r_y0": 490.33,
+ "r_x1": 274.0,
+ "r_y1": 490.33,
+ "r_x2": 274.0,
+ "r_y2": 506.33,
+ "r_x3": 385.67,
+ "r_y3": 506.33,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 27,
+ "id": 12,
"label": "text",
"bbox": {
- "l": 542.27,
- "t": 265.46,
- "r": 590.22,
- "b": 279.18,
+ "l": 292.67,
+ "t": 459.0,
+ "r": 363.0,
+ "b": 475.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 11,
@@ -2064,36 +2409,36 @@
"a": 255
},
"rect": {
- "r_x0": 542.27,
- "r_y0": 279.18,
- "r_x1": 590.22,
- "r_y1": 279.18,
- "r_x2": 590.22,
- "r_y2": 265.46,
- "r_x3": 542.27,
- "r_y3": 265.46,
+ "r_x0": 363.0,
+ "r_y0": 459.0,
+ "r_x1": 292.67,
+ "r_y1": 459.0,
+ "r_x2": 292.67,
+ "r_y2": 475.0,
+ "r_x3": 363.0,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 28,
+ "id": 13,
"label": "text",
"bbox": {
- "l": 319.15,
- "t": 265.46,
- "r": 357.35,
- "b": 279.18,
+ "l": 278.0,
+ "t": 408.0,
+ "r": 383.67,
+ "b": 424.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 12,
@@ -2104,21 +2449,141 @@
"a": 255
},
"rect": {
- "r_x0": 319.15,
- "r_y0": 279.18,
- "r_x1": 357.35,
- "r_y1": 279.18,
- "r_x2": 357.35,
- "r_y2": 265.46,
- "r_x3": 319.15,
- "r_y3": 265.46,
+ "r_x0": 383.67,
+ "r_y0": 408.0,
+ "r_x1": 278.0,
+ "r_y1": 408.0,
+ "r_x2": 278.0,
+ "r_y2": 424.0,
+ "r_x3": 383.67,
+ "r_y3": 424.0,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 14,
+ "label": "text",
+ "bbox": {
+ "l": 304.33,
+ "t": 376.0,
+ "r": 351.33,
+ "b": 392.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 351.33,
+ "r_y0": 376.0,
+ "r_x1": 304.33,
+ "r_y1": 376.0,
+ "r_x2": 304.33,
+ "r_y2": 392.0,
+ "r_x3": 351.33,
+ "r_y3": 392.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 15,
+ "label": "text",
+ "bbox": {
+ "l": 278.0,
+ "t": 328.0,
+ "r": 383.67,
+ "b": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 383.67,
+ "r_y0": 328.0,
+ "r_x1": 278.0,
+ "r_y1": 328.0,
+ "r_x2": 278.0,
+ "r_y2": 344.0,
+ "r_x3": 383.67,
+ "r_y3": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 16,
+ "label": "text",
+ "bbox": {
+ "l": 304.33,
+ "t": 296.67,
+ "r": 351.33,
+ "b": 312.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 351.33,
+ "r_y0": 296.67,
+ "r_x1": 304.33,
+ "r_y1": 296.67,
+ "r_x2": 304.33,
+ "r_y2": 312.67,
+ "r_x3": 351.33,
+ "r_y3": 312.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
@@ -2130,261 +2595,25 @@
"ched",
"ched",
"ched",
- "ched",
"nl",
"fcel",
"fcel",
- "ecel",
- "fcel",
- "nl",
- "fcel",
- "fcel",
- "fcel",
"fcel",
"nl",
"fcel",
"fcel",
"fcel",
- "ecel",
"nl"
],
- "num_rows": 4,
- "num_cols": 4,
+ "num_rows": 3,
+ "num_cols": 3,
"table_cells": [
{
"bbox": {
- "l": 534.41,
- "t": 474.71,
- "r": 596.97,
- "b": 488.43,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "Column 0",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 420.78,
- "t": 474.71,
- "r": 483.35,
- "b": 488.43,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "Column 1",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 307.16,
- "t": 474.71,
- "r": 369.73,
- "b": 488.43,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "Column 2",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 641.33,
- "t": 407.21,
- "r": 718.47,
- "b": 420.93,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "this is row 0",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 531.29,
- "t": 407.21,
- "r": 600.35,
- "b": 420.93,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "some cells",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 410.9,
- "t": 407.21,
- "r": 494.6,
- "b": 420.93,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "have content",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 326.21,
- "t": 407.21,
- "r": 350.6,
- "b": 420.93,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "and",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 647.54,
- "t": 338.59,
- "r": 711.72,
- "b": 352.3,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "and row 1",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 435.41,
- "t": 338.59,
- "r": 468.73,
- "b": 352.3,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "other",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 323.39,
- "t": 338.59,
- "r": 355.1,
- "b": 352.3,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "have",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 634.24,
- "t": 265.46,
- "r": 725.22,
- "b": 279.18,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "and last row 2",
- "column_header": true,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 542.27,
- "t": 265.46,
- "r": 590.22,
- "b": 279.18,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "nothing",
- "column_header": true,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 319.15,
- "t": 265.46,
- "r": 357.35,
- "b": 279.18,
+ "l": 97.33,
+ "t": 105.67,
+ "r": 190.0,
+ "b": 126.33,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -2393,10 +2622,162 @@
"end_row_offset_idx": 1,
"start_col_offset_idx": 0,
"end_col_offset_idx": 1,
- "text": "inside",
+ "text": "Vertically merged",
"column_header": true,
"row_header": false,
"row_section": false
+ },
+ {
+ "bbox": {
+ "l": 121.67,
+ "t": 204.0,
+ "r": 168.67,
+ "b": 220.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 0,
+ "end_col_offset_idx": 1,
+ "text": "value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 121.67,
+ "t": 284.0,
+ "r": 168.67,
+ "b": 300.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 2,
+ "end_row_offset_idx": 3,
+ "start_col_offset_idx": 0,
+ "end_col_offset_idx": 1,
+ "text": "value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 232.33,
+ "t": 105.67,
+ "r": 363.67,
+ "b": 126.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Other merged column",
+ "column_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 247.0,
+ "t": 188.0,
+ "r": 349.67,
+ "b": 204.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Some other value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 247.0,
+ "t": 268.0,
+ "r": 349.67,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 2,
+ "end_row_offset_idx": 3,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Some other value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 406.33,
+ "t": 105.67,
+ "r": 518.0,
+ "b": 121.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another column",
+ "column_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 408.33,
+ "t": 188.0,
+ "r": 514.0,
+ "b": 204.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 408.33,
+ "t": 268.0,
+ "r": 514.0,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 2,
+ "end_row_offset_idx": 3,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
}
]
}
@@ -2416,13 +2797,13 @@
"id": 0,
"label": "table",
"bbox": {
- "l": 280.59,
- "t": 233.73,
- "r": 738.57,
- "b": 519.09,
+ "l": 240.9,
+ "t": 277.42,
+ "r": 722.95,
+ "b": 524.35,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.955,
+ "confidence": 0.979,
"cells": [
{
"index": 0,
@@ -2433,21 +2814,21 @@
"a": 255
},
"rect": {
- "r_x0": 534.41,
- "r_y0": 488.43,
- "r_x1": 596.97,
- "r_y1": 488.43,
- "r_x2": 596.97,
- "r_y2": 474.71,
- "r_x3": 534.41,
- "r_y3": 474.71,
+ "r_x0": 694.67,
+ "r_y0": 485.67,
+ "r_x1": 602.0,
+ "r_y1": 485.67,
+ "r_x2": 602.0,
+ "r_y2": 506.33,
+ "r_x3": 694.67,
+ "r_y3": 506.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
},
{
"index": 1,
@@ -2458,21 +2839,21 @@
"a": 255
},
"rect": {
- "r_x0": 420.78,
- "r_y0": 488.43,
- "r_x1": 483.35,
- "r_y1": 488.43,
- "r_x2": 483.35,
- "r_y2": 474.71,
- "r_x3": 420.78,
- "r_y3": 474.71,
+ "r_x0": 680.0,
+ "r_y0": 454.33,
+ "r_x1": 610.0,
+ "r_y1": 454.33,
+ "r_x2": 610.0,
+ "r_y2": 475.0,
+ "r_x3": 680.0,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
},
{
"index": 2,
@@ -2483,21 +2864,21 @@
"a": 255
},
"rect": {
- "r_x0": 307.16,
- "r_y0": 488.43,
- "r_x1": 369.73,
- "r_y1": 488.43,
- "r_x2": 369.73,
- "r_y2": 474.71,
- "r_x3": 307.16,
- "r_y3": 474.71,
+ "r_x0": 670.33,
+ "r_y0": 392.0,
+ "r_x1": 623.33,
+ "r_y1": 392.0,
+ "r_x2": 623.33,
+ "r_y2": 408.0,
+ "r_x3": 670.33,
+ "r_y3": 408.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 3,
@@ -2508,21 +2889,21 @@
"a": 255
},
"rect": {
- "r_x0": 641.33,
- "r_y0": 420.93,
- "r_x1": 718.47,
- "r_y1": 420.93,
- "r_x2": 718.47,
- "r_y2": 407.21,
- "r_x3": 641.33,
- "r_y3": 407.21,
+ "r_x0": 670.33,
+ "r_y0": 312.0,
+ "r_x1": 623.33,
+ "r_y1": 312.0,
+ "r_x2": 623.33,
+ "r_y2": 328.0,
+ "r_x3": 670.33,
+ "r_y3": 328.0,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 4,
@@ -2533,21 +2914,21 @@
"a": 255
},
"rect": {
- "r_x0": 531.29,
- "r_y0": 420.93,
- "r_x1": 600.35,
- "r_y1": 420.93,
- "r_x2": 600.35,
- "r_y2": 407.21,
- "r_x3": 531.29,
- "r_y3": 407.21,
+ "r_x0": 559.67,
+ "r_y0": 485.67,
+ "r_x1": 428.33,
+ "r_y1": 485.67,
+ "r_x2": 428.33,
+ "r_y2": 506.33,
+ "r_x3": 559.67,
+ "r_y3": 506.33,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 5,
@@ -2558,21 +2939,21 @@
"a": 255
},
"rect": {
- "r_x0": 410.9,
- "r_y0": 420.93,
- "r_x1": 494.6,
- "r_y1": 420.93,
- "r_x2": 494.6,
- "r_y2": 407.21,
- "r_x3": 410.9,
- "r_y3": 407.21,
+ "r_x0": 526.67,
+ "r_y0": 459.0,
+ "r_x1": 456.0,
+ "r_y1": 459.0,
+ "r_x2": 456.0,
+ "r_y2": 475.0,
+ "r_x3": 526.67,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 6,
@@ -2583,21 +2964,21 @@
"a": 255
},
"rect": {
- "r_x0": 326.21,
- "r_y0": 420.93,
- "r_x1": 350.6,
- "r_y1": 420.93,
- "r_x2": 350.6,
- "r_y2": 407.21,
- "r_x3": 326.21,
- "r_y3": 407.21,
+ "r_x0": 545.0,
+ "r_y0": 408.0,
+ "r_x1": 442.33,
+ "r_y1": 408.0,
+ "r_x2": 442.33,
+ "r_y2": 424.0,
+ "r_x3": 545.0,
+ "r_y3": 424.0,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 91.0,
+ "from_ocr": true
},
{
"index": 7,
@@ -2608,21 +2989,21 @@
"a": 255
},
"rect": {
- "r_x0": 647.54,
- "r_y0": 352.3,
- "r_x1": 711.72,
- "r_y1": 352.3,
- "r_x2": 711.72,
- "r_y2": 338.59,
- "r_x3": 647.54,
- "r_y3": 338.59,
+ "r_x0": 515.0,
+ "r_y0": 376.0,
+ "r_x1": 468.0,
+ "r_y1": 376.0,
+ "r_x2": 468.0,
+ "r_y2": 392.0,
+ "r_x3": 515.0,
+ "r_y3": 392.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 8,
@@ -2633,21 +3014,21 @@
"a": 255
},
"rect": {
- "r_x0": 435.41,
- "r_y0": 352.3,
- "r_x1": 468.73,
- "r_y1": 352.3,
- "r_x2": 468.73,
- "r_y2": 338.59,
- "r_x3": 435.41,
- "r_y3": 338.59,
+ "r_x0": 545.0,
+ "r_y0": 328.0,
+ "r_x1": 442.33,
+ "r_y1": 328.0,
+ "r_x2": 442.33,
+ "r_y2": 344.0,
+ "r_x3": 545.0,
+ "r_y3": 344.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 9,
@@ -2658,21 +3039,21 @@
"a": 255
},
"rect": {
- "r_x0": 323.39,
- "r_y0": 352.3,
- "r_x1": 355.1,
- "r_y1": 352.3,
- "r_x2": 355.1,
- "r_y2": 338.59,
- "r_x3": 323.39,
- "r_y3": 338.59,
+ "r_x0": 515.0,
+ "r_y0": 296.67,
+ "r_x1": 468.0,
+ "r_y1": 296.67,
+ "r_x2": 468.0,
+ "r_y2": 312.67,
+ "r_x3": 515.0,
+ "r_y3": 312.67,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 10,
@@ -2683,21 +3064,21 @@
"a": 255
},
"rect": {
- "r_x0": 634.24,
- "r_y0": 279.18,
- "r_x1": 725.22,
- "r_y1": 279.18,
- "r_x2": 725.22,
- "r_y2": 265.46,
- "r_x3": 634.24,
- "r_y3": 265.46,
+ "r_x0": 385.67,
+ "r_y0": 490.33,
+ "r_x1": 274.0,
+ "r_y1": 490.33,
+ "r_x2": 274.0,
+ "r_y2": 506.33,
+ "r_x3": 385.67,
+ "r_y3": 506.33,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 11,
@@ -2708,21 +3089,21 @@
"a": 255
},
"rect": {
- "r_x0": 542.27,
- "r_y0": 279.18,
- "r_x1": 590.22,
- "r_y1": 279.18,
- "r_x2": 590.22,
- "r_y2": 265.46,
- "r_x3": 542.27,
- "r_y3": 265.46,
+ "r_x0": 363.0,
+ "r_y0": 459.0,
+ "r_x1": 292.67,
+ "r_y1": 459.0,
+ "r_x2": 292.67,
+ "r_y2": 475.0,
+ "r_x3": 363.0,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 12,
@@ -2733,35 +3114,110 @@
"a": 255
},
"rect": {
- "r_x0": 319.15,
- "r_y0": 279.18,
- "r_x1": 357.35,
- "r_y1": 279.18,
- "r_x2": 357.35,
- "r_y2": 265.46,
- "r_x3": 319.15,
- "r_y3": 265.46,
+ "r_x0": 383.67,
+ "r_y0": 408.0,
+ "r_x1": 278.0,
+ "r_y1": 408.0,
+ "r_x2": 278.0,
+ "r_y2": 424.0,
+ "r_x3": 383.67,
+ "r_y3": 424.0,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
+ },
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 351.33,
+ "r_y0": 376.0,
+ "r_x1": 304.33,
+ "r_y1": 376.0,
+ "r_x2": 304.33,
+ "r_y2": 392.0,
+ "r_x3": 351.33,
+ "r_y3": 392.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ },
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 383.67,
+ "r_y0": 328.0,
+ "r_x1": 278.0,
+ "r_y1": 328.0,
+ "r_x2": 278.0,
+ "r_y2": 344.0,
+ "r_x3": 383.67,
+ "r_y3": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ },
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 351.33,
+ "r_y0": 296.67,
+ "r_x1": 304.33,
+ "r_y1": 296.67,
+ "r_x2": 304.33,
+ "r_y2": 312.67,
+ "r_x3": 351.33,
+ "r_y3": 312.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": [
{
- "id": 16,
+ "id": 1,
"label": "text",
"bbox": {
- "l": 534.41,
- "t": 474.71,
- "r": 596.97,
- "b": 488.43,
+ "l": 602.0,
+ "t": 485.67,
+ "r": 694.67,
+ "b": 506.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 90.0,
"cells": [
{
"index": 0,
@@ -2772,36 +3228,36 @@
"a": 255
},
"rect": {
- "r_x0": 534.41,
- "r_y0": 488.43,
- "r_x1": 596.97,
- "r_y1": 488.43,
- "r_x2": 596.97,
- "r_y2": 474.71,
- "r_x3": 534.41,
- "r_y3": 474.71,
+ "r_x0": 694.67,
+ "r_y0": 485.67,
+ "r_x1": 602.0,
+ "r_y1": 485.67,
+ "r_x2": 602.0,
+ "r_y2": 506.33,
+ "r_x3": 694.67,
+ "r_y3": 506.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 17,
+ "id": 2,
"label": "text",
"bbox": {
- "l": 420.78,
- "t": 474.71,
- "r": 483.35,
- "b": 488.43,
+ "l": 610.0,
+ "t": 454.33,
+ "r": 680.0,
+ "b": 475.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 90.0,
"cells": [
{
"index": 1,
@@ -2812,36 +3268,36 @@
"a": 255
},
"rect": {
- "r_x0": 420.78,
- "r_y0": 488.43,
- "r_x1": 483.35,
- "r_y1": 488.43,
- "r_x2": 483.35,
- "r_y2": 474.71,
- "r_x3": 420.78,
- "r_y3": 474.71,
+ "r_x0": 680.0,
+ "r_y0": 454.33,
+ "r_x1": 610.0,
+ "r_y1": 454.33,
+ "r_x2": 610.0,
+ "r_y2": 475.0,
+ "r_x3": 680.0,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 18,
+ "id": 3,
"label": "text",
"bbox": {
- "l": 307.16,
- "t": 474.71,
- "r": 369.73,
- "b": 488.43,
+ "l": 623.33,
+ "t": 392.0,
+ "r": 670.33,
+ "b": 408.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 2,
@@ -2852,36 +3308,36 @@
"a": 255
},
"rect": {
- "r_x0": 307.16,
- "r_y0": 488.43,
- "r_x1": 369.73,
- "r_y1": 488.43,
- "r_x2": 369.73,
- "r_y2": 474.71,
- "r_x3": 307.16,
- "r_y3": 474.71,
+ "r_x0": 670.33,
+ "r_y0": 392.0,
+ "r_x1": 623.33,
+ "r_y1": 392.0,
+ "r_x2": 623.33,
+ "r_y2": 408.0,
+ "r_x3": 670.33,
+ "r_y3": 408.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 19,
+ "id": 4,
"label": "text",
"bbox": {
- "l": 641.33,
- "t": 407.21,
- "r": 718.47,
- "b": 420.93,
+ "l": 623.33,
+ "t": 312.0,
+ "r": 670.33,
+ "b": 328.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 3,
@@ -2892,36 +3348,36 @@
"a": 255
},
"rect": {
- "r_x0": 641.33,
- "r_y0": 420.93,
- "r_x1": 718.47,
- "r_y1": 420.93,
- "r_x2": 718.47,
- "r_y2": 407.21,
- "r_x3": 641.33,
- "r_y3": 407.21,
+ "r_x0": 670.33,
+ "r_y0": 312.0,
+ "r_x1": 623.33,
+ "r_y1": 312.0,
+ "r_x2": 623.33,
+ "r_y2": 328.0,
+ "r_x3": 670.33,
+ "r_y3": 328.0,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 20,
+ "id": 5,
"label": "text",
"bbox": {
- "l": 531.29,
- "t": 407.21,
- "r": 600.35,
- "b": 420.93,
+ "l": 428.33,
+ "t": 485.67,
+ "r": 559.67,
+ "b": 506.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 92.0,
"cells": [
{
"index": 4,
@@ -2932,36 +3388,36 @@
"a": 255
},
"rect": {
- "r_x0": 531.29,
- "r_y0": 420.93,
- "r_x1": 600.35,
- "r_y1": 420.93,
- "r_x2": 600.35,
- "r_y2": 407.21,
- "r_x3": 531.29,
- "r_y3": 407.21,
+ "r_x0": 559.67,
+ "r_y0": 485.67,
+ "r_x1": 428.33,
+ "r_y1": 485.67,
+ "r_x2": 428.33,
+ "r_y2": 506.33,
+ "r_x3": 559.67,
+ "r_y3": 506.33,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 21,
+ "id": 6,
"label": "text",
"bbox": {
- "l": 410.9,
- "t": 407.21,
- "r": 494.6,
- "b": 420.93,
+ "l": 456.0,
+ "t": 459.0,
+ "r": 526.67,
+ "b": 475.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 5,
@@ -2972,36 +3428,36 @@
"a": 255
},
"rect": {
- "r_x0": 410.9,
- "r_y0": 420.93,
- "r_x1": 494.6,
- "r_y1": 420.93,
- "r_x2": 494.6,
- "r_y2": 407.21,
- "r_x3": 410.9,
- "r_y3": 407.21,
+ "r_x0": 526.67,
+ "r_y0": 459.0,
+ "r_x1": 456.0,
+ "r_y1": 459.0,
+ "r_x2": 456.0,
+ "r_y2": 475.0,
+ "r_x3": 526.67,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 22,
+ "id": 7,
"label": "text",
"bbox": {
- "l": 326.21,
- "t": 407.21,
- "r": 350.6,
- "b": 420.93,
+ "l": 442.33,
+ "t": 408.0,
+ "r": 545.0,
+ "b": 424.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 91.0,
"cells": [
{
"index": 6,
@@ -3012,36 +3468,36 @@
"a": 255
},
"rect": {
- "r_x0": 326.21,
- "r_y0": 420.93,
- "r_x1": 350.6,
- "r_y1": 420.93,
- "r_x2": 350.6,
- "r_y2": 407.21,
- "r_x3": 326.21,
- "r_y3": 407.21,
+ "r_x0": 545.0,
+ "r_y0": 408.0,
+ "r_x1": 442.33,
+ "r_y1": 408.0,
+ "r_x2": 442.33,
+ "r_y2": 424.0,
+ "r_x3": 545.0,
+ "r_y3": 424.0,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 91.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 23,
+ "id": 8,
"label": "text",
"bbox": {
- "l": 647.54,
- "t": 338.59,
- "r": 711.72,
- "b": 352.3,
+ "l": 468.0,
+ "t": 376.0,
+ "r": 515.0,
+ "b": 392.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 7,
@@ -3052,36 +3508,36 @@
"a": 255
},
"rect": {
- "r_x0": 647.54,
- "r_y0": 352.3,
- "r_x1": 711.72,
- "r_y1": 352.3,
- "r_x2": 711.72,
- "r_y2": 338.59,
- "r_x3": 647.54,
- "r_y3": 338.59,
+ "r_x0": 515.0,
+ "r_y0": 376.0,
+ "r_x1": 468.0,
+ "r_y1": 376.0,
+ "r_x2": 468.0,
+ "r_y2": 392.0,
+ "r_x3": 515.0,
+ "r_y3": 392.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 24,
+ "id": 9,
"label": "text",
"bbox": {
- "l": 435.41,
- "t": 338.59,
- "r": 468.73,
- "b": 352.3,
+ "l": 442.33,
+ "t": 328.0,
+ "r": 545.0,
+ "b": 344.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 8,
@@ -3092,36 +3548,36 @@
"a": 255
},
"rect": {
- "r_x0": 435.41,
- "r_y0": 352.3,
- "r_x1": 468.73,
- "r_y1": 352.3,
- "r_x2": 468.73,
- "r_y2": 338.59,
- "r_x3": 435.41,
- "r_y3": 338.59,
+ "r_x0": 545.0,
+ "r_y0": 328.0,
+ "r_x1": 442.33,
+ "r_y1": 328.0,
+ "r_x2": 442.33,
+ "r_y2": 344.0,
+ "r_x3": 545.0,
+ "r_y3": 344.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 25,
+ "id": 10,
"label": "text",
"bbox": {
- "l": 323.39,
- "t": 338.59,
- "r": 355.1,
- "b": 352.3,
+ "l": 468.0,
+ "t": 296.67,
+ "r": 515.0,
+ "b": 312.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 9,
@@ -3132,36 +3588,36 @@
"a": 255
},
"rect": {
- "r_x0": 323.39,
- "r_y0": 352.3,
- "r_x1": 355.1,
- "r_y1": 352.3,
- "r_x2": 355.1,
- "r_y2": 338.59,
- "r_x3": 323.39,
- "r_y3": 338.59,
+ "r_x0": 515.0,
+ "r_y0": 296.67,
+ "r_x1": 468.0,
+ "r_y1": 296.67,
+ "r_x2": 468.0,
+ "r_y2": 312.67,
+ "r_x3": 515.0,
+ "r_y3": 312.67,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 26,
+ "id": 11,
"label": "text",
"bbox": {
- "l": 634.24,
- "t": 265.46,
- "r": 725.22,
- "b": 279.18,
+ "l": 274.0,
+ "t": 490.33,
+ "r": 385.67,
+ "b": 506.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 10,
@@ -3172,36 +3628,36 @@
"a": 255
},
"rect": {
- "r_x0": 634.24,
- "r_y0": 279.18,
- "r_x1": 725.22,
- "r_y1": 279.18,
- "r_x2": 725.22,
- "r_y2": 265.46,
- "r_x3": 634.24,
- "r_y3": 265.46,
+ "r_x0": 385.67,
+ "r_y0": 490.33,
+ "r_x1": 274.0,
+ "r_y1": 490.33,
+ "r_x2": 274.0,
+ "r_y2": 506.33,
+ "r_x3": 385.67,
+ "r_y3": 506.33,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 27,
+ "id": 12,
"label": "text",
"bbox": {
- "l": 542.27,
- "t": 265.46,
- "r": 590.22,
- "b": 279.18,
+ "l": 292.67,
+ "t": 459.0,
+ "r": 363.0,
+ "b": 475.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 11,
@@ -3212,36 +3668,36 @@
"a": 255
},
"rect": {
- "r_x0": 542.27,
- "r_y0": 279.18,
- "r_x1": 590.22,
- "r_y1": 279.18,
- "r_x2": 590.22,
- "r_y2": 265.46,
- "r_x3": 542.27,
- "r_y3": 265.46,
+ "r_x0": 363.0,
+ "r_y0": 459.0,
+ "r_x1": 292.67,
+ "r_y1": 459.0,
+ "r_x2": 292.67,
+ "r_y2": 475.0,
+ "r_x3": 363.0,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 28,
+ "id": 13,
"label": "text",
"bbox": {
- "l": 319.15,
- "t": 265.46,
- "r": 357.35,
- "b": 279.18,
+ "l": 278.0,
+ "t": 408.0,
+ "r": 383.67,
+ "b": 424.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 12,
@@ -3252,21 +3708,141 @@
"a": 255
},
"rect": {
- "r_x0": 319.15,
- "r_y0": 279.18,
- "r_x1": 357.35,
- "r_y1": 279.18,
- "r_x2": 357.35,
- "r_y2": 265.46,
- "r_x3": 319.15,
- "r_y3": 265.46,
+ "r_x0": 383.67,
+ "r_y0": 408.0,
+ "r_x1": 278.0,
+ "r_y1": 408.0,
+ "r_x2": 278.0,
+ "r_y2": 424.0,
+ "r_x3": 383.67,
+ "r_y3": 424.0,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 14,
+ "label": "text",
+ "bbox": {
+ "l": 304.33,
+ "t": 376.0,
+ "r": 351.33,
+ "b": 392.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 351.33,
+ "r_y0": 376.0,
+ "r_x1": 304.33,
+ "r_y1": 376.0,
+ "r_x2": 304.33,
+ "r_y2": 392.0,
+ "r_x3": 351.33,
+ "r_y3": 392.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 15,
+ "label": "text",
+ "bbox": {
+ "l": 278.0,
+ "t": 328.0,
+ "r": 383.67,
+ "b": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 383.67,
+ "r_y0": 328.0,
+ "r_x1": 278.0,
+ "r_y1": 328.0,
+ "r_x2": 278.0,
+ "r_y2": 344.0,
+ "r_x3": 383.67,
+ "r_y3": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 16,
+ "label": "text",
+ "bbox": {
+ "l": 304.33,
+ "t": 296.67,
+ "r": 351.33,
+ "b": 312.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 351.33,
+ "r_y0": 296.67,
+ "r_x1": 304.33,
+ "r_y1": 296.67,
+ "r_x2": 304.33,
+ "r_y2": 312.67,
+ "r_x3": 351.33,
+ "r_y3": 312.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
@@ -3278,261 +3854,25 @@
"ched",
"ched",
"ched",
- "ched",
"nl",
"fcel",
"fcel",
- "ecel",
- "fcel",
- "nl",
- "fcel",
- "fcel",
- "fcel",
"fcel",
"nl",
"fcel",
"fcel",
"fcel",
- "ecel",
"nl"
],
- "num_rows": 4,
- "num_cols": 4,
+ "num_rows": 3,
+ "num_cols": 3,
"table_cells": [
{
"bbox": {
- "l": 534.41,
- "t": 474.71,
- "r": 596.97,
- "b": 488.43,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "Column 0",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 420.78,
- "t": 474.71,
- "r": 483.35,
- "b": 488.43,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "Column 1",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 307.16,
- "t": 474.71,
- "r": 369.73,
- "b": 488.43,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "Column 2",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 641.33,
- "t": 407.21,
- "r": 718.47,
- "b": 420.93,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "this is row 0",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 531.29,
- "t": 407.21,
- "r": 600.35,
- "b": 420.93,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "some cells",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 410.9,
- "t": 407.21,
- "r": 494.6,
- "b": 420.93,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "have content",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 326.21,
- "t": 407.21,
- "r": 350.6,
- "b": 420.93,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "and",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 647.54,
- "t": 338.59,
- "r": 711.72,
- "b": 352.3,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "and row 1",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 435.41,
- "t": 338.59,
- "r": 468.73,
- "b": 352.3,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "other",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 323.39,
- "t": 338.59,
- "r": 355.1,
- "b": 352.3,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "have",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 634.24,
- "t": 265.46,
- "r": 725.22,
- "b": 279.18,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "and last row 2",
- "column_header": true,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 542.27,
- "t": 265.46,
- "r": 590.22,
- "b": 279.18,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "nothing",
- "column_header": true,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 319.15,
- "t": 265.46,
- "r": 357.35,
- "b": 279.18,
+ "l": 97.33,
+ "t": 105.67,
+ "r": 190.0,
+ "b": 126.33,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -3541,10 +3881,162 @@
"end_row_offset_idx": 1,
"start_col_offset_idx": 0,
"end_col_offset_idx": 1,
- "text": "inside",
+ "text": "Vertically merged",
"column_header": true,
"row_header": false,
"row_section": false
+ },
+ {
+ "bbox": {
+ "l": 121.67,
+ "t": 204.0,
+ "r": 168.67,
+ "b": 220.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 0,
+ "end_col_offset_idx": 1,
+ "text": "value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 121.67,
+ "t": 284.0,
+ "r": 168.67,
+ "b": 300.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 2,
+ "end_row_offset_idx": 3,
+ "start_col_offset_idx": 0,
+ "end_col_offset_idx": 1,
+ "text": "value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 232.33,
+ "t": 105.67,
+ "r": 363.67,
+ "b": 126.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Other merged column",
+ "column_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 247.0,
+ "t": 188.0,
+ "r": 349.67,
+ "b": 204.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Some other value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 247.0,
+ "t": 268.0,
+ "r": 349.67,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 2,
+ "end_row_offset_idx": 3,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Some other value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 406.33,
+ "t": 105.67,
+ "r": 518.0,
+ "b": 121.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another column",
+ "column_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 408.33,
+ "t": 188.0,
+ "r": 514.0,
+ "b": 204.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 408.33,
+ "t": 268.0,
+ "r": 514.0,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 2,
+ "end_row_offset_idx": 3,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
}
]
}
@@ -3558,13 +4050,13 @@
"id": 0,
"label": "table",
"bbox": {
- "l": 280.59,
- "t": 233.73,
- "r": 738.57,
- "b": 519.09,
+ "l": 240.9,
+ "t": 277.42,
+ "r": 722.95,
+ "b": 524.35,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.955,
+ "confidence": 0.979,
"cells": [
{
"index": 0,
@@ -3575,21 +4067,21 @@
"a": 255
},
"rect": {
- "r_x0": 534.41,
- "r_y0": 488.43,
- "r_x1": 596.97,
- "r_y1": 488.43,
- "r_x2": 596.97,
- "r_y2": 474.71,
- "r_x3": 534.41,
- "r_y3": 474.71,
+ "r_x0": 694.67,
+ "r_y0": 485.67,
+ "r_x1": 602.0,
+ "r_y1": 485.67,
+ "r_x2": 602.0,
+ "r_y2": 506.33,
+ "r_x3": 694.67,
+ "r_y3": 506.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
},
{
"index": 1,
@@ -3600,21 +4092,21 @@
"a": 255
},
"rect": {
- "r_x0": 420.78,
- "r_y0": 488.43,
- "r_x1": 483.35,
- "r_y1": 488.43,
- "r_x2": 483.35,
- "r_y2": 474.71,
- "r_x3": 420.78,
- "r_y3": 474.71,
+ "r_x0": 680.0,
+ "r_y0": 454.33,
+ "r_x1": 610.0,
+ "r_y1": 454.33,
+ "r_x2": 610.0,
+ "r_y2": 475.0,
+ "r_x3": 680.0,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
},
{
"index": 2,
@@ -3625,21 +4117,21 @@
"a": 255
},
"rect": {
- "r_x0": 307.16,
- "r_y0": 488.43,
- "r_x1": 369.73,
- "r_y1": 488.43,
- "r_x2": 369.73,
- "r_y2": 474.71,
- "r_x3": 307.16,
- "r_y3": 474.71,
+ "r_x0": 670.33,
+ "r_y0": 392.0,
+ "r_x1": 623.33,
+ "r_y1": 392.0,
+ "r_x2": 623.33,
+ "r_y2": 408.0,
+ "r_x3": 670.33,
+ "r_y3": 408.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 3,
@@ -3650,21 +4142,21 @@
"a": 255
},
"rect": {
- "r_x0": 641.33,
- "r_y0": 420.93,
- "r_x1": 718.47,
- "r_y1": 420.93,
- "r_x2": 718.47,
- "r_y2": 407.21,
- "r_x3": 641.33,
- "r_y3": 407.21,
+ "r_x0": 670.33,
+ "r_y0": 312.0,
+ "r_x1": 623.33,
+ "r_y1": 312.0,
+ "r_x2": 623.33,
+ "r_y2": 328.0,
+ "r_x3": 670.33,
+ "r_y3": 328.0,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 4,
@@ -3675,21 +4167,21 @@
"a": 255
},
"rect": {
- "r_x0": 531.29,
- "r_y0": 420.93,
- "r_x1": 600.35,
- "r_y1": 420.93,
- "r_x2": 600.35,
- "r_y2": 407.21,
- "r_x3": 531.29,
- "r_y3": 407.21,
+ "r_x0": 559.67,
+ "r_y0": 485.67,
+ "r_x1": 428.33,
+ "r_y1": 485.67,
+ "r_x2": 428.33,
+ "r_y2": 506.33,
+ "r_x3": 559.67,
+ "r_y3": 506.33,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 5,
@@ -3700,21 +4192,21 @@
"a": 255
},
"rect": {
- "r_x0": 410.9,
- "r_y0": 420.93,
- "r_x1": 494.6,
- "r_y1": 420.93,
- "r_x2": 494.6,
- "r_y2": 407.21,
- "r_x3": 410.9,
- "r_y3": 407.21,
+ "r_x0": 526.67,
+ "r_y0": 459.0,
+ "r_x1": 456.0,
+ "r_y1": 459.0,
+ "r_x2": 456.0,
+ "r_y2": 475.0,
+ "r_x3": 526.67,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 6,
@@ -3725,21 +4217,21 @@
"a": 255
},
"rect": {
- "r_x0": 326.21,
- "r_y0": 420.93,
- "r_x1": 350.6,
- "r_y1": 420.93,
- "r_x2": 350.6,
- "r_y2": 407.21,
- "r_x3": 326.21,
- "r_y3": 407.21,
+ "r_x0": 545.0,
+ "r_y0": 408.0,
+ "r_x1": 442.33,
+ "r_y1": 408.0,
+ "r_x2": 442.33,
+ "r_y2": 424.0,
+ "r_x3": 545.0,
+ "r_y3": 424.0,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 91.0,
+ "from_ocr": true
},
{
"index": 7,
@@ -3750,21 +4242,21 @@
"a": 255
},
"rect": {
- "r_x0": 647.54,
- "r_y0": 352.3,
- "r_x1": 711.72,
- "r_y1": 352.3,
- "r_x2": 711.72,
- "r_y2": 338.59,
- "r_x3": 647.54,
- "r_y3": 338.59,
+ "r_x0": 515.0,
+ "r_y0": 376.0,
+ "r_x1": 468.0,
+ "r_y1": 376.0,
+ "r_x2": 468.0,
+ "r_y2": 392.0,
+ "r_x3": 515.0,
+ "r_y3": 392.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 8,
@@ -3775,21 +4267,21 @@
"a": 255
},
"rect": {
- "r_x0": 435.41,
- "r_y0": 352.3,
- "r_x1": 468.73,
- "r_y1": 352.3,
- "r_x2": 468.73,
- "r_y2": 338.59,
- "r_x3": 435.41,
- "r_y3": 338.59,
+ "r_x0": 545.0,
+ "r_y0": 328.0,
+ "r_x1": 442.33,
+ "r_y1": 328.0,
+ "r_x2": 442.33,
+ "r_y2": 344.0,
+ "r_x3": 545.0,
+ "r_y3": 344.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 9,
@@ -3800,21 +4292,21 @@
"a": 255
},
"rect": {
- "r_x0": 323.39,
- "r_y0": 352.3,
- "r_x1": 355.1,
- "r_y1": 352.3,
- "r_x2": 355.1,
- "r_y2": 338.59,
- "r_x3": 323.39,
- "r_y3": 338.59,
+ "r_x0": 515.0,
+ "r_y0": 296.67,
+ "r_x1": 468.0,
+ "r_y1": 296.67,
+ "r_x2": 468.0,
+ "r_y2": 312.67,
+ "r_x3": 515.0,
+ "r_y3": 312.67,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 10,
@@ -3825,21 +4317,21 @@
"a": 255
},
"rect": {
- "r_x0": 634.24,
- "r_y0": 279.18,
- "r_x1": 725.22,
- "r_y1": 279.18,
- "r_x2": 725.22,
- "r_y2": 265.46,
- "r_x3": 634.24,
- "r_y3": 265.46,
+ "r_x0": 385.67,
+ "r_y0": 490.33,
+ "r_x1": 274.0,
+ "r_y1": 490.33,
+ "r_x2": 274.0,
+ "r_y2": 506.33,
+ "r_x3": 385.67,
+ "r_y3": 506.33,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 11,
@@ -3850,21 +4342,21 @@
"a": 255
},
"rect": {
- "r_x0": 542.27,
- "r_y0": 279.18,
- "r_x1": 590.22,
- "r_y1": 279.18,
- "r_x2": 590.22,
- "r_y2": 265.46,
- "r_x3": 542.27,
- "r_y3": 265.46,
+ "r_x0": 363.0,
+ "r_y0": 459.0,
+ "r_x1": 292.67,
+ "r_y1": 459.0,
+ "r_x2": 292.67,
+ "r_y2": 475.0,
+ "r_x3": 363.0,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 12,
@@ -3875,35 +4367,110 @@
"a": 255
},
"rect": {
- "r_x0": 319.15,
- "r_y0": 279.18,
- "r_x1": 357.35,
- "r_y1": 279.18,
- "r_x2": 357.35,
- "r_y2": 265.46,
- "r_x3": 319.15,
- "r_y3": 265.46,
+ "r_x0": 383.67,
+ "r_y0": 408.0,
+ "r_x1": 278.0,
+ "r_y1": 408.0,
+ "r_x2": 278.0,
+ "r_y2": 424.0,
+ "r_x3": 383.67,
+ "r_y3": 424.0,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
+ },
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 351.33,
+ "r_y0": 376.0,
+ "r_x1": 304.33,
+ "r_y1": 376.0,
+ "r_x2": 304.33,
+ "r_y2": 392.0,
+ "r_x3": 351.33,
+ "r_y3": 392.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ },
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 383.67,
+ "r_y0": 328.0,
+ "r_x1": 278.0,
+ "r_y1": 328.0,
+ "r_x2": 278.0,
+ "r_y2": 344.0,
+ "r_x3": 383.67,
+ "r_y3": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ },
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 351.33,
+ "r_y0": 296.67,
+ "r_x1": 304.33,
+ "r_y1": 296.67,
+ "r_x2": 304.33,
+ "r_y2": 312.67,
+ "r_x3": 351.33,
+ "r_y3": 312.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": [
{
- "id": 16,
+ "id": 1,
"label": "text",
"bbox": {
- "l": 534.41,
- "t": 474.71,
- "r": 596.97,
- "b": 488.43,
+ "l": 602.0,
+ "t": 485.67,
+ "r": 694.67,
+ "b": 506.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 90.0,
"cells": [
{
"index": 0,
@@ -3914,36 +4481,36 @@
"a": 255
},
"rect": {
- "r_x0": 534.41,
- "r_y0": 488.43,
- "r_x1": 596.97,
- "r_y1": 488.43,
- "r_x2": 596.97,
- "r_y2": 474.71,
- "r_x3": 534.41,
- "r_y3": 474.71,
+ "r_x0": 694.67,
+ "r_y0": 485.67,
+ "r_x1": 602.0,
+ "r_y1": 485.67,
+ "r_x2": 602.0,
+ "r_y2": 506.33,
+ "r_x3": 694.67,
+ "r_y3": 506.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 17,
+ "id": 2,
"label": "text",
"bbox": {
- "l": 420.78,
- "t": 474.71,
- "r": 483.35,
- "b": 488.43,
+ "l": 610.0,
+ "t": 454.33,
+ "r": 680.0,
+ "b": 475.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 90.0,
"cells": [
{
"index": 1,
@@ -3954,36 +4521,36 @@
"a": 255
},
"rect": {
- "r_x0": 420.78,
- "r_y0": 488.43,
- "r_x1": 483.35,
- "r_y1": 488.43,
- "r_x2": 483.35,
- "r_y2": 474.71,
- "r_x3": 420.78,
- "r_y3": 474.71,
+ "r_x0": 680.0,
+ "r_y0": 454.33,
+ "r_x1": 610.0,
+ "r_y1": 454.33,
+ "r_x2": 610.0,
+ "r_y2": 475.0,
+ "r_x3": 680.0,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 18,
+ "id": 3,
"label": "text",
"bbox": {
- "l": 307.16,
- "t": 474.71,
- "r": 369.73,
- "b": 488.43,
+ "l": 623.33,
+ "t": 392.0,
+ "r": 670.33,
+ "b": 408.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 2,
@@ -3994,36 +4561,36 @@
"a": 255
},
"rect": {
- "r_x0": 307.16,
- "r_y0": 488.43,
- "r_x1": 369.73,
- "r_y1": 488.43,
- "r_x2": 369.73,
- "r_y2": 474.71,
- "r_x3": 307.16,
- "r_y3": 474.71,
+ "r_x0": 670.33,
+ "r_y0": 392.0,
+ "r_x1": 623.33,
+ "r_y1": 392.0,
+ "r_x2": 623.33,
+ "r_y2": 408.0,
+ "r_x3": 670.33,
+ "r_y3": 408.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 19,
+ "id": 4,
"label": "text",
"bbox": {
- "l": 641.33,
- "t": 407.21,
- "r": 718.47,
- "b": 420.93,
+ "l": 623.33,
+ "t": 312.0,
+ "r": 670.33,
+ "b": 328.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 3,
@@ -4034,36 +4601,36 @@
"a": 255
},
"rect": {
- "r_x0": 641.33,
- "r_y0": 420.93,
- "r_x1": 718.47,
- "r_y1": 420.93,
- "r_x2": 718.47,
- "r_y2": 407.21,
- "r_x3": 641.33,
- "r_y3": 407.21,
+ "r_x0": 670.33,
+ "r_y0": 312.0,
+ "r_x1": 623.33,
+ "r_y1": 312.0,
+ "r_x2": 623.33,
+ "r_y2": 328.0,
+ "r_x3": 670.33,
+ "r_y3": 328.0,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 20,
+ "id": 5,
"label": "text",
"bbox": {
- "l": 531.29,
- "t": 407.21,
- "r": 600.35,
- "b": 420.93,
+ "l": 428.33,
+ "t": 485.67,
+ "r": 559.67,
+ "b": 506.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 92.0,
"cells": [
{
"index": 4,
@@ -4074,36 +4641,36 @@
"a": 255
},
"rect": {
- "r_x0": 531.29,
- "r_y0": 420.93,
- "r_x1": 600.35,
- "r_y1": 420.93,
- "r_x2": 600.35,
- "r_y2": 407.21,
- "r_x3": 531.29,
- "r_y3": 407.21,
+ "r_x0": 559.67,
+ "r_y0": 485.67,
+ "r_x1": 428.33,
+ "r_y1": 485.67,
+ "r_x2": 428.33,
+ "r_y2": 506.33,
+ "r_x3": 559.67,
+ "r_y3": 506.33,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 21,
+ "id": 6,
"label": "text",
"bbox": {
- "l": 410.9,
- "t": 407.21,
- "r": 494.6,
- "b": 420.93,
+ "l": 456.0,
+ "t": 459.0,
+ "r": 526.67,
+ "b": 475.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 5,
@@ -4114,36 +4681,36 @@
"a": 255
},
"rect": {
- "r_x0": 410.9,
- "r_y0": 420.93,
- "r_x1": 494.6,
- "r_y1": 420.93,
- "r_x2": 494.6,
- "r_y2": 407.21,
- "r_x3": 410.9,
- "r_y3": 407.21,
+ "r_x0": 526.67,
+ "r_y0": 459.0,
+ "r_x1": 456.0,
+ "r_y1": 459.0,
+ "r_x2": 456.0,
+ "r_y2": 475.0,
+ "r_x3": 526.67,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 22,
+ "id": 7,
"label": "text",
"bbox": {
- "l": 326.21,
- "t": 407.21,
- "r": 350.6,
- "b": 420.93,
+ "l": 442.33,
+ "t": 408.0,
+ "r": 545.0,
+ "b": 424.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 91.0,
"cells": [
{
"index": 6,
@@ -4154,36 +4721,36 @@
"a": 255
},
"rect": {
- "r_x0": 326.21,
- "r_y0": 420.93,
- "r_x1": 350.6,
- "r_y1": 420.93,
- "r_x2": 350.6,
- "r_y2": 407.21,
- "r_x3": 326.21,
- "r_y3": 407.21,
+ "r_x0": 545.0,
+ "r_y0": 408.0,
+ "r_x1": 442.33,
+ "r_y1": 408.0,
+ "r_x2": 442.33,
+ "r_y2": 424.0,
+ "r_x3": 545.0,
+ "r_y3": 424.0,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 91.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 23,
+ "id": 8,
"label": "text",
"bbox": {
- "l": 647.54,
- "t": 338.59,
- "r": 711.72,
- "b": 352.3,
+ "l": 468.0,
+ "t": 376.0,
+ "r": 515.0,
+ "b": 392.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 7,
@@ -4194,36 +4761,36 @@
"a": 255
},
"rect": {
- "r_x0": 647.54,
- "r_y0": 352.3,
- "r_x1": 711.72,
- "r_y1": 352.3,
- "r_x2": 711.72,
- "r_y2": 338.59,
- "r_x3": 647.54,
- "r_y3": 338.59,
+ "r_x0": 515.0,
+ "r_y0": 376.0,
+ "r_x1": 468.0,
+ "r_y1": 376.0,
+ "r_x2": 468.0,
+ "r_y2": 392.0,
+ "r_x3": 515.0,
+ "r_y3": 392.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 24,
+ "id": 9,
"label": "text",
"bbox": {
- "l": 435.41,
- "t": 338.59,
- "r": 468.73,
- "b": 352.3,
+ "l": 442.33,
+ "t": 328.0,
+ "r": 545.0,
+ "b": 344.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 8,
@@ -4234,36 +4801,36 @@
"a": 255
},
"rect": {
- "r_x0": 435.41,
- "r_y0": 352.3,
- "r_x1": 468.73,
- "r_y1": 352.3,
- "r_x2": 468.73,
- "r_y2": 338.59,
- "r_x3": 435.41,
- "r_y3": 338.59,
+ "r_x0": 545.0,
+ "r_y0": 328.0,
+ "r_x1": 442.33,
+ "r_y1": 328.0,
+ "r_x2": 442.33,
+ "r_y2": 344.0,
+ "r_x3": 545.0,
+ "r_y3": 344.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 25,
+ "id": 10,
"label": "text",
"bbox": {
- "l": 323.39,
- "t": 338.59,
- "r": 355.1,
- "b": 352.3,
+ "l": 468.0,
+ "t": 296.67,
+ "r": 515.0,
+ "b": 312.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 9,
@@ -4274,36 +4841,36 @@
"a": 255
},
"rect": {
- "r_x0": 323.39,
- "r_y0": 352.3,
- "r_x1": 355.1,
- "r_y1": 352.3,
- "r_x2": 355.1,
- "r_y2": 338.59,
- "r_x3": 323.39,
- "r_y3": 338.59,
+ "r_x0": 515.0,
+ "r_y0": 296.67,
+ "r_x1": 468.0,
+ "r_y1": 296.67,
+ "r_x2": 468.0,
+ "r_y2": 312.67,
+ "r_x3": 515.0,
+ "r_y3": 312.67,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 26,
+ "id": 11,
"label": "text",
"bbox": {
- "l": 634.24,
- "t": 265.46,
- "r": 725.22,
- "b": 279.18,
+ "l": 274.0,
+ "t": 490.33,
+ "r": 385.67,
+ "b": 506.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 10,
@@ -4314,36 +4881,36 @@
"a": 255
},
"rect": {
- "r_x0": 634.24,
- "r_y0": 279.18,
- "r_x1": 725.22,
- "r_y1": 279.18,
- "r_x2": 725.22,
- "r_y2": 265.46,
- "r_x3": 634.24,
- "r_y3": 265.46,
+ "r_x0": 385.67,
+ "r_y0": 490.33,
+ "r_x1": 274.0,
+ "r_y1": 490.33,
+ "r_x2": 274.0,
+ "r_y2": 506.33,
+ "r_x3": 385.67,
+ "r_y3": 506.33,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 27,
+ "id": 12,
"label": "text",
"bbox": {
- "l": 542.27,
- "t": 265.46,
- "r": 590.22,
- "b": 279.18,
+ "l": 292.67,
+ "t": 459.0,
+ "r": 363.0,
+ "b": 475.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 11,
@@ -4354,36 +4921,36 @@
"a": 255
},
"rect": {
- "r_x0": 542.27,
- "r_y0": 279.18,
- "r_x1": 590.22,
- "r_y1": 279.18,
- "r_x2": 590.22,
- "r_y2": 265.46,
- "r_x3": 542.27,
- "r_y3": 265.46,
+ "r_x0": 363.0,
+ "r_y0": 459.0,
+ "r_x1": 292.67,
+ "r_y1": 459.0,
+ "r_x2": 292.67,
+ "r_y2": 475.0,
+ "r_x3": 363.0,
+ "r_y3": 475.0,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 28,
+ "id": 13,
"label": "text",
"bbox": {
- "l": 319.15,
- "t": 265.46,
- "r": 357.35,
- "b": 279.18,
+ "l": 278.0,
+ "t": 408.0,
+ "r": 383.67,
+ "b": 424.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 12,
@@ -4394,21 +4961,141 @@
"a": 255
},
"rect": {
- "r_x0": 319.15,
- "r_y0": 279.18,
- "r_x1": 357.35,
- "r_y1": 279.18,
- "r_x2": 357.35,
- "r_y2": 265.46,
- "r_x3": 319.15,
- "r_y3": 265.46,
+ "r_x0": 383.67,
+ "r_y0": 408.0,
+ "r_x1": 278.0,
+ "r_y1": 408.0,
+ "r_x2": 278.0,
+ "r_y2": 424.0,
+ "r_x3": 383.67,
+ "r_y3": 424.0,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 14,
+ "label": "text",
+ "bbox": {
+ "l": 304.33,
+ "t": 376.0,
+ "r": 351.33,
+ "b": 392.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 351.33,
+ "r_y0": 376.0,
+ "r_x1": 304.33,
+ "r_y1": 376.0,
+ "r_x2": 304.33,
+ "r_y2": 392.0,
+ "r_x3": 351.33,
+ "r_y3": 392.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 15,
+ "label": "text",
+ "bbox": {
+ "l": 278.0,
+ "t": 328.0,
+ "r": 383.67,
+ "b": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 94.0,
+ "cells": [
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 383.67,
+ "r_y0": 328.0,
+ "r_x1": 278.0,
+ "r_y1": 328.0,
+ "r_x2": 278.0,
+ "r_y2": 344.0,
+ "r_x3": 383.67,
+ "r_y3": 344.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 94.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 16,
+ "label": "text",
+ "bbox": {
+ "l": 304.33,
+ "t": 296.67,
+ "r": 351.33,
+ "b": 312.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 351.33,
+ "r_y0": 296.67,
+ "r_x1": 304.33,
+ "r_y1": 296.67,
+ "r_x2": 304.33,
+ "r_y2": 312.67,
+ "r_x3": 351.33,
+ "r_y3": 312.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
@@ -4420,261 +5107,25 @@
"ched",
"ched",
"ched",
- "ched",
"nl",
"fcel",
"fcel",
- "ecel",
- "fcel",
- "nl",
- "fcel",
- "fcel",
- "fcel",
"fcel",
"nl",
"fcel",
"fcel",
"fcel",
- "ecel",
"nl"
],
- "num_rows": 4,
- "num_cols": 4,
+ "num_rows": 3,
+ "num_cols": 3,
"table_cells": [
{
"bbox": {
- "l": 534.41,
- "t": 474.71,
- "r": 596.97,
- "b": 488.43,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "Column 0",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 420.78,
- "t": 474.71,
- "r": 483.35,
- "b": 488.43,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "Column 1",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 307.16,
- "t": 474.71,
- "r": 369.73,
- "b": 488.43,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "Column 2",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 641.33,
- "t": 407.21,
- "r": 718.47,
- "b": 420.93,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "this is row 0",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 531.29,
- "t": 407.21,
- "r": 600.35,
- "b": 420.93,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "some cells",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 410.9,
- "t": 407.21,
- "r": 494.6,
- "b": 420.93,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "have content",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 326.21,
- "t": 407.21,
- "r": 350.6,
- "b": 420.93,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "and",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 647.54,
- "t": 338.59,
- "r": 711.72,
- "b": 352.3,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "and row 1",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 435.41,
- "t": 338.59,
- "r": 468.73,
- "b": 352.3,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "other",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 323.39,
- "t": 338.59,
- "r": 355.1,
- "b": 352.3,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "have",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 634.24,
- "t": 265.46,
- "r": 725.22,
- "b": 279.18,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "and last row 2",
- "column_header": true,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 542.27,
- "t": 265.46,
- "r": 590.22,
- "b": 279.18,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "nothing",
- "column_header": true,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 319.15,
- "t": 265.46,
- "r": 357.35,
- "b": 279.18,
+ "l": 97.33,
+ "t": 105.67,
+ "r": 190.0,
+ "b": 126.33,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -4683,10 +5134,162 @@
"end_row_offset_idx": 1,
"start_col_offset_idx": 0,
"end_col_offset_idx": 1,
- "text": "inside",
+ "text": "Vertically merged",
"column_header": true,
"row_header": false,
"row_section": false
+ },
+ {
+ "bbox": {
+ "l": 121.67,
+ "t": 204.0,
+ "r": 168.67,
+ "b": 220.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 0,
+ "end_col_offset_idx": 1,
+ "text": "value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 121.67,
+ "t": 284.0,
+ "r": 168.67,
+ "b": 300.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 2,
+ "end_row_offset_idx": 3,
+ "start_col_offset_idx": 0,
+ "end_col_offset_idx": 1,
+ "text": "value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 232.33,
+ "t": 105.67,
+ "r": 363.67,
+ "b": 126.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Other merged column",
+ "column_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 247.0,
+ "t": 188.0,
+ "r": 349.67,
+ "b": 204.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Some other value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 247.0,
+ "t": 268.0,
+ "r": 349.67,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 2,
+ "end_row_offset_idx": 3,
+ "start_col_offset_idx": 1,
+ "end_col_offset_idx": 2,
+ "text": "Some other value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 406.33,
+ "t": 105.67,
+ "r": 518.0,
+ "b": 121.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 0,
+ "end_row_offset_idx": 1,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another column",
+ "column_header": true,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 408.33,
+ "t": 188.0,
+ "r": 514.0,
+ "b": 204.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 1,
+ "end_row_offset_idx": 2,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
+ },
+ {
+ "bbox": {
+ "l": 408.33,
+ "t": 268.0,
+ "r": 514.0,
+ "b": 284.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "row_span": 1,
+ "col_span": 1,
+ "start_row_offset_idx": 2,
+ "end_row_offset_idx": 3,
+ "start_col_offset_idx": 2,
+ "end_col_offset_idx": 3,
+ "text": "Yet another value",
+ "column_header": false,
+ "row_header": false,
+ "row_section": false
}
]
}
diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_270.doctags.txt b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_270.doctags.txt
index 213dcced..d693f790 100644
--- a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_270.doctags.txt
+++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_270.doctags.txt
@@ -1,2 +1,2 @@
-and last row 2and row 1this is row 0nothingsome cellsColumn 0otherhave contentColumn 1insidehaveandColumn 2
+Yet another valueSome other valuevalue
\ No newline at end of file
diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_270.json b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_270.json
index 28b62daa..9bc6ea25 100644
--- a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_270.json
+++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_270.json
@@ -4,7 +4,7 @@
"name": "ocr_test_rotated_270",
"origin": {
"mimetype": "application/pdf",
- "binary_hash": 142009988718862333,
+ "binary_hash": 8365439800722100027,
"filename": "ocr_test_rotated_270.pdf"
},
"furniture": {
@@ -41,10 +41,10 @@
{
"page_no": 1,
"bbox": {
- "l": 233.88,
- "t": 739.02,
- "r": 519.9,
- "b": 280.96,
+ "l": 277.42,
+ "t": 722.96,
+ "r": 524.35,
+ "b": 240.9,
"coord_origin": "BOTTOMLEFT"
},
"charspan": [
@@ -60,67 +60,10 @@
"table_cells": [
{
"bbox": {
- "l": 474.71,
- "t": 245.03,
- "r": 488.43,
- "b": 307.59,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "Column 0",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 474.71,
- "t": 358.65,
- "r": 488.43,
- "b": 421.22,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "Column 1",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 474.71,
- "t": 472.27,
- "r": 488.43,
- "b": 534.84,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "Column 2",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 407.21,
- "t": 123.53,
- "r": 420.93,
- "b": 200.67,
+ "l": 443.33,
+ "t": 312.0,
+ "r": 490.33,
+ "b": 328.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -129,74 +72,17 @@
"end_row_offset_idx": 1,
"start_col_offset_idx": 2,
"end_col_offset_idx": 3,
- "text": "this is row 0",
+ "text": "value",
"column_header": false,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 407.21,
- "t": 241.65,
- "r": 420.93,
- "b": 310.71,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "some cells",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 407.21,
- "t": 347.4,
- "r": 420.93,
- "b": 431.1,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "have content",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 407.21,
- "t": 491.4,
- "r": 420.93,
- "b": 515.79,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "and",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 338.59,
- "t": 130.28,
- "r": 352.3,
- "b": 194.46,
+ "l": 262.33,
+ "t": 296.67,
+ "r": 365.0,
+ "b": 344.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -205,55 +91,17 @@
"end_row_offset_idx": 1,
"start_col_offset_idx": 1,
"end_col_offset_idx": 2,
- "text": "and row 1",
+ "text": "Some other value",
"column_header": false,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 338.59,
- "t": 373.27,
- "r": 352.3,
- "b": 406.59,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "other",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 338.59,
- "t": 486.9,
- "r": 352.3,
- "b": 518.61,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "have",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 265.46,
- "t": 116.78,
- "r": 279.18,
- "b": 207.76,
+ "l": 98.0,
+ "t": 296.67,
+ "r": 203.67,
+ "b": 344.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -262,60 +110,22 @@
"end_row_offset_idx": 1,
"start_col_offset_idx": 0,
"end_col_offset_idx": 1,
- "text": "and last row 2",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 265.46,
- "t": 251.78,
- "r": 279.18,
- "b": 299.73,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "nothing",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 265.46,
- "t": 484.65,
- "r": 279.18,
- "b": 522.85,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "inside",
+ "text": "Yet another value",
"column_header": false,
"row_header": false,
"row_section": false
}
],
- "num_rows": 4,
- "num_cols": 4,
+ "num_rows": 1,
+ "num_cols": 3,
"grid": [
[
{
"bbox": {
- "l": 265.46,
- "t": 116.78,
- "r": 279.18,
- "b": 207.76,
+ "l": 98.0,
+ "t": 296.67,
+ "r": 203.67,
+ "b": 344.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -324,17 +134,17 @@
"end_row_offset_idx": 1,
"start_col_offset_idx": 0,
"end_col_offset_idx": 1,
- "text": "and last row 2",
+ "text": "Yet another value",
"column_header": false,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 338.59,
- "t": 130.28,
- "r": 352.3,
- "b": 194.46,
+ "l": 262.33,
+ "t": 296.67,
+ "r": 365.0,
+ "b": 344.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -343,17 +153,17 @@
"end_row_offset_idx": 1,
"start_col_offset_idx": 1,
"end_col_offset_idx": 2,
- "text": "and row 1",
+ "text": "Some other value",
"column_header": false,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 407.21,
- "t": 123.53,
- "r": 420.93,
- "b": 200.67,
+ "l": 443.33,
+ "t": 312.0,
+ "r": 490.33,
+ "b": 328.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -362,239 +172,7 @@
"end_row_offset_idx": 1,
"start_col_offset_idx": 2,
"end_col_offset_idx": 3,
- "text": "this is row 0",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "",
- "column_header": false,
- "row_header": false,
- "row_section": false
- }
- ],
- [
- {
- "bbox": {
- "l": 265.46,
- "t": 251.78,
- "r": 279.18,
- "b": 299.73,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "nothing",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 407.21,
- "t": 241.65,
- "r": 420.93,
- "b": 310.71,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "some cells",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 474.71,
- "t": 245.03,
- "r": 488.43,
- "b": 307.59,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "Column 0",
- "column_header": false,
- "row_header": false,
- "row_section": false
- }
- ],
- [
- {
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 338.59,
- "t": 373.27,
- "r": 352.3,
- "b": 406.59,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "other",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 407.21,
- "t": 347.4,
- "r": 420.93,
- "b": 431.1,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "have content",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 474.71,
- "t": 358.65,
- "r": 488.43,
- "b": 421.22,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "Column 1",
- "column_header": false,
- "row_header": false,
- "row_section": false
- }
- ],
- [
- {
- "bbox": {
- "l": 265.46,
- "t": 484.65,
- "r": 279.18,
- "b": 522.85,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "inside",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 338.59,
- "t": 486.9,
- "r": 352.3,
- "b": 518.61,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "have",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 407.21,
- "t": 491.4,
- "r": 420.93,
- "b": 515.79,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "and",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 474.71,
- "t": 472.27,
- "r": 488.43,
- "b": 534.84,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "Column 2",
+ "text": "value",
"column_header": false,
"row_header": false,
"row_section": false
@@ -610,8 +188,8 @@
"pages": {
"1": {
"size": {
- "width": 595.0,
- "height": 842.0
+ "width": 612.0,
+ "height": 792.0
},
"page_no": 1
}
diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_270.md b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_270.md
index f423a6c2..e69de29b 100644
--- a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_270.md
+++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_270.md
@@ -1,5 +0,0 @@
-| and last row 2 | and row 1 | this is row 0 | |
-|------------------|-------------|-----------------|----------|
-| nothing | | some cells | Column 0 |
-| | other | have content | Column 1 |
-| inside | have | and | Column 2 |
\ No newline at end of file
diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_270.pages.json b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_270.pages.json
index 339cb0a4..d77269ce 100644
--- a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_270.pages.json
+++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_270.pages.json
@@ -2,8 +2,8 @@
{
"page_no": 0,
"size": {
- "width": 595.0,
- "height": 842.0
+ "width": 612.0,
+ "height": 792.0
},
"parsed_page": {
"dimension": {
@@ -11,47 +11,47 @@
"rect": {
"r_x0": 0.0,
"r_y0": 0.0,
- "r_x1": 842.0,
+ "r_x1": 792.0,
"r_y1": 0.0,
- "r_x2": 842.0,
- "r_y2": 595.0,
+ "r_x2": 792.0,
+ "r_y2": 612.0,
"r_x3": 0.0,
- "r_y3": 595.0,
+ "r_y3": 612.0,
"coord_origin": "BOTTOMLEFT"
},
"boundary_type": "crop_box",
"art_bbox": {
"l": 0.0,
- "t": 595.0,
- "r": 842.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
},
"bleed_bbox": {
"l": 0.0,
- "t": 595.0,
- "r": 842.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
},
"crop_bbox": {
"l": 0.0,
- "t": 595.0,
- "r": 842.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
},
"media_bbox": {
"l": 0.0,
- "t": 595.0,
- "r": 842.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
},
"trim_bbox": {
"l": 0.0,
- "t": 595.0,
- "r": 842.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
}
@@ -69,21 +69,21 @@
"a": 255
},
"rect": {
- "r_x0": 474.71,
- "r_y0": 307.59,
- "r_x1": 488.43,
- "r_y1": 307.59,
- "r_x2": 488.43,
- "r_y2": 245.03,
- "r_x3": 474.71,
- "r_y3": 245.03,
+ "r_x0": 485.67,
+ "r_y0": 97.33,
+ "r_x1": 485.67,
+ "r_y1": 190.0,
+ "r_x2": 506.33,
+ "r_y2": 190.0,
+ "r_x3": 506.33,
+ "r_y3": 97.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 89.0,
+ "from_ocr": true
},
{
"index": 1,
@@ -94,21 +94,21 @@
"a": 255
},
"rect": {
- "r_x0": 474.71,
- "r_y0": 421.22,
- "r_x1": 488.43,
- "r_y1": 421.22,
- "r_x2": 488.43,
- "r_y2": 358.65,
- "r_x3": 474.71,
- "r_y3": 358.65,
+ "r_x0": 454.33,
+ "r_y0": 112.0,
+ "r_x1": 454.33,
+ "r_y1": 182.33,
+ "r_x2": 475.0,
+ "r_y2": 182.33,
+ "r_x3": 475.0,
+ "r_y3": 112.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 2,
@@ -119,21 +119,21 @@
"a": 255
},
"rect": {
- "r_x0": 474.71,
- "r_y0": 534.84,
- "r_x1": 488.43,
- "r_y1": 534.84,
- "r_x2": 488.43,
- "r_y2": 472.27,
- "r_x3": 474.71,
- "r_y3": 472.27,
+ "r_x0": 392.0,
+ "r_y0": 121.67,
+ "r_x1": 392.0,
+ "r_y1": 168.67,
+ "r_x2": 408.0,
+ "r_y2": 168.67,
+ "r_x3": 408.0,
+ "r_y3": 121.67,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 3,
@@ -144,21 +144,21 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 200.67,
- "r_x1": 420.93,
- "r_y1": 200.67,
- "r_x2": 420.93,
- "r_y2": 123.53,
- "r_x3": 407.21,
- "r_y3": 123.53,
+ "r_x0": 312.0,
+ "r_y0": 121.67,
+ "r_x1": 312.0,
+ "r_y1": 168.67,
+ "r_x2": 328.0,
+ "r_y2": 168.67,
+ "r_x3": 328.0,
+ "r_y3": 121.67,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 4,
@@ -169,21 +169,21 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 310.71,
- "r_x1": 420.93,
- "r_y1": 310.71,
- "r_x2": 420.93,
- "r_y2": 241.65,
- "r_x3": 407.21,
- "r_y3": 241.65,
+ "r_x0": 485.67,
+ "r_y0": 232.67,
+ "r_x1": 485.67,
+ "r_y1": 364.0,
+ "r_x2": 506.33,
+ "r_y2": 364.0,
+ "r_x3": 506.33,
+ "r_y3": 232.67,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 5,
@@ -194,21 +194,21 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 431.1,
- "r_x1": 420.93,
- "r_y1": 431.1,
- "r_x2": 420.93,
- "r_y2": 347.4,
- "r_x3": 407.21,
- "r_y3": 347.4,
+ "r_x0": 459.0,
+ "r_y0": 265.67,
+ "r_x1": 459.0,
+ "r_y1": 336.0,
+ "r_x2": 475.0,
+ "r_y2": 336.0,
+ "r_x3": 475.0,
+ "r_y3": 265.67,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 6,
@@ -219,21 +219,21 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 515.79,
- "r_x1": 420.93,
- "r_y1": 515.79,
- "r_x2": 420.93,
- "r_y2": 491.4,
- "r_x3": 407.21,
- "r_y3": 491.4,
+ "r_x0": 408.0,
+ "r_y0": 247.0,
+ "r_x1": 408.0,
+ "r_y1": 349.67,
+ "r_x2": 424.0,
+ "r_y2": 349.67,
+ "r_x3": 424.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 89.0,
+ "from_ocr": true
},
{
"index": 7,
@@ -244,21 +244,21 @@
"a": 255
},
"rect": {
- "r_x0": 338.59,
- "r_y0": 194.46,
- "r_x1": 352.3,
- "r_y1": 194.46,
- "r_x2": 352.3,
- "r_y2": 130.28,
- "r_x3": 338.59,
- "r_y3": 130.28,
+ "r_x0": 376.0,
+ "r_y0": 277.0,
+ "r_x1": 376.0,
+ "r_y1": 324.33,
+ "r_x2": 392.0,
+ "r_y2": 324.33,
+ "r_x3": 392.0,
+ "r_y3": 277.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 8,
@@ -269,21 +269,21 @@
"a": 255
},
"rect": {
- "r_x0": 338.59,
- "r_y0": 406.59,
- "r_x1": 352.3,
- "r_y1": 406.59,
- "r_x2": 352.3,
- "r_y2": 373.27,
- "r_x3": 338.59,
- "r_y3": 373.27,
+ "r_x0": 328.0,
+ "r_y0": 247.0,
+ "r_x1": 328.0,
+ "r_y1": 349.67,
+ "r_x2": 344.0,
+ "r_y2": 349.67,
+ "r_x3": 344.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 9,
@@ -294,21 +294,21 @@
"a": 255
},
"rect": {
- "r_x0": 338.59,
- "r_y0": 518.61,
- "r_x1": 352.3,
- "r_y1": 518.61,
- "r_x2": 352.3,
- "r_y2": 486.9,
- "r_x3": 338.59,
- "r_y3": 486.9,
+ "r_x0": 296.67,
+ "r_y0": 277.33,
+ "r_x1": 296.67,
+ "r_y1": 324.33,
+ "r_x2": 312.67,
+ "r_y2": 324.33,
+ "r_x3": 312.67,
+ "r_y3": 277.33,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 10,
@@ -319,21 +319,21 @@
"a": 255
},
"rect": {
- "r_x0": 265.46,
- "r_y0": 207.76,
- "r_x1": 279.18,
- "r_y1": 207.76,
- "r_x2": 279.18,
- "r_y2": 116.78,
- "r_x3": 265.46,
- "r_y3": 116.78,
+ "r_x0": 490.33,
+ "r_y0": 406.33,
+ "r_x1": 490.33,
+ "r_y1": 518.33,
+ "r_x2": 506.33,
+ "r_y2": 518.33,
+ "r_x3": 506.33,
+ "r_y3": 406.33,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 11,
@@ -344,21 +344,21 @@
"a": 255
},
"rect": {
- "r_x0": 265.46,
- "r_y0": 299.73,
- "r_x1": 279.18,
- "r_y1": 299.73,
- "r_x2": 279.18,
- "r_y2": 251.78,
- "r_x3": 265.46,
- "r_y3": 251.78,
+ "r_x0": 459.0,
+ "r_y0": 429.33,
+ "r_x1": 459.0,
+ "r_y1": 499.33,
+ "r_x2": 475.0,
+ "r_y2": 499.33,
+ "r_x3": 475.0,
+ "r_y3": 429.33,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 12,
@@ -369,21 +369,96 @@
"a": 255
},
"rect": {
- "r_x0": 265.46,
- "r_y0": 522.85,
- "r_x1": 279.18,
- "r_y1": 522.85,
- "r_x2": 279.18,
- "r_y2": 484.65,
- "r_x3": 265.46,
- "r_y3": 484.65,
+ "r_x0": 408.0,
+ "r_y0": 408.33,
+ "r_x1": 408.0,
+ "r_y1": 514.0,
+ "r_x2": 424.0,
+ "r_y2": 514.0,
+ "r_x3": 424.0,
+ "r_y3": 408.33,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 376.0,
+ "r_y0": 440.67,
+ "r_x1": 376.0,
+ "r_y1": 487.67,
+ "r_x2": 392.0,
+ "r_y2": 487.67,
+ "r_x3": 392.0,
+ "r_y3": 440.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ },
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 328.0,
+ "r_y0": 408.33,
+ "r_x1": 328.0,
+ "r_y1": 514.0,
+ "r_x2": 344.0,
+ "r_y2": 514.0,
+ "r_x3": 344.0,
+ "r_y3": 408.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 296.67,
+ "r_y0": 440.67,
+ "r_x1": 296.67,
+ "r_y1": 487.67,
+ "r_x2": 312.67,
+ "r_y2": 487.67,
+ "r_x3": 312.67,
+ "r_y3": 440.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"has_chars": false,
@@ -399,13 +474,13 @@
"id": 0,
"label": "table",
"bbox": {
- "l": 233.88,
- "t": 102.98,
- "r": 519.9,
- "b": 561.04,
+ "l": 277.42,
+ "t": 69.04,
+ "r": 524.35,
+ "b": 551.1,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.967,
+ "confidence": 0.979,
"cells": [
{
"index": 0,
@@ -416,21 +491,21 @@
"a": 255
},
"rect": {
- "r_x0": 474.71,
- "r_y0": 307.59,
- "r_x1": 488.43,
- "r_y1": 307.59,
- "r_x2": 488.43,
- "r_y2": 245.03,
- "r_x3": 474.71,
- "r_y3": 245.03,
+ "r_x0": 485.67,
+ "r_y0": 97.33,
+ "r_x1": 485.67,
+ "r_y1": 190.0,
+ "r_x2": 506.33,
+ "r_y2": 190.0,
+ "r_x3": 506.33,
+ "r_y3": 97.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 89.0,
+ "from_ocr": true
},
{
"index": 1,
@@ -441,21 +516,21 @@
"a": 255
},
"rect": {
- "r_x0": 474.71,
- "r_y0": 421.22,
- "r_x1": 488.43,
- "r_y1": 421.22,
- "r_x2": 488.43,
- "r_y2": 358.65,
- "r_x3": 474.71,
- "r_y3": 358.65,
+ "r_x0": 454.33,
+ "r_y0": 112.0,
+ "r_x1": 454.33,
+ "r_y1": 182.33,
+ "r_x2": 475.0,
+ "r_y2": 182.33,
+ "r_x3": 475.0,
+ "r_y3": 112.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 2,
@@ -466,21 +541,21 @@
"a": 255
},
"rect": {
- "r_x0": 474.71,
- "r_y0": 534.84,
- "r_x1": 488.43,
- "r_y1": 534.84,
- "r_x2": 488.43,
- "r_y2": 472.27,
- "r_x3": 474.71,
- "r_y3": 472.27,
+ "r_x0": 392.0,
+ "r_y0": 121.67,
+ "r_x1": 392.0,
+ "r_y1": 168.67,
+ "r_x2": 408.0,
+ "r_y2": 168.67,
+ "r_x3": 408.0,
+ "r_y3": 121.67,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 3,
@@ -491,21 +566,21 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 200.67,
- "r_x1": 420.93,
- "r_y1": 200.67,
- "r_x2": 420.93,
- "r_y2": 123.53,
- "r_x3": 407.21,
- "r_y3": 123.53,
+ "r_x0": 312.0,
+ "r_y0": 121.67,
+ "r_x1": 312.0,
+ "r_y1": 168.67,
+ "r_x2": 328.0,
+ "r_y2": 168.67,
+ "r_x3": 328.0,
+ "r_y3": 121.67,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 4,
@@ -516,21 +591,21 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 310.71,
- "r_x1": 420.93,
- "r_y1": 310.71,
- "r_x2": 420.93,
- "r_y2": 241.65,
- "r_x3": 407.21,
- "r_y3": 241.65,
+ "r_x0": 485.67,
+ "r_y0": 232.67,
+ "r_x1": 485.67,
+ "r_y1": 364.0,
+ "r_x2": 506.33,
+ "r_y2": 364.0,
+ "r_x3": 506.33,
+ "r_y3": 232.67,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 5,
@@ -541,21 +616,21 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 431.1,
- "r_x1": 420.93,
- "r_y1": 431.1,
- "r_x2": 420.93,
- "r_y2": 347.4,
- "r_x3": 407.21,
- "r_y3": 347.4,
+ "r_x0": 459.0,
+ "r_y0": 265.67,
+ "r_x1": 459.0,
+ "r_y1": 336.0,
+ "r_x2": 475.0,
+ "r_y2": 336.0,
+ "r_x3": 475.0,
+ "r_y3": 265.67,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 6,
@@ -566,21 +641,21 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 515.79,
- "r_x1": 420.93,
- "r_y1": 515.79,
- "r_x2": 420.93,
- "r_y2": 491.4,
- "r_x3": 407.21,
- "r_y3": 491.4,
+ "r_x0": 408.0,
+ "r_y0": 247.0,
+ "r_x1": 408.0,
+ "r_y1": 349.67,
+ "r_x2": 424.0,
+ "r_y2": 349.67,
+ "r_x3": 424.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 89.0,
+ "from_ocr": true
},
{
"index": 7,
@@ -591,21 +666,21 @@
"a": 255
},
"rect": {
- "r_x0": 338.59,
- "r_y0": 194.46,
- "r_x1": 352.3,
- "r_y1": 194.46,
- "r_x2": 352.3,
- "r_y2": 130.28,
- "r_x3": 338.59,
- "r_y3": 130.28,
+ "r_x0": 376.0,
+ "r_y0": 277.0,
+ "r_x1": 376.0,
+ "r_y1": 324.33,
+ "r_x2": 392.0,
+ "r_y2": 324.33,
+ "r_x3": 392.0,
+ "r_y3": 277.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 8,
@@ -616,21 +691,21 @@
"a": 255
},
"rect": {
- "r_x0": 338.59,
- "r_y0": 406.59,
- "r_x1": 352.3,
- "r_y1": 406.59,
- "r_x2": 352.3,
- "r_y2": 373.27,
- "r_x3": 338.59,
- "r_y3": 373.27,
+ "r_x0": 328.0,
+ "r_y0": 247.0,
+ "r_x1": 328.0,
+ "r_y1": 349.67,
+ "r_x2": 344.0,
+ "r_y2": 349.67,
+ "r_x3": 344.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 9,
@@ -641,21 +716,21 @@
"a": 255
},
"rect": {
- "r_x0": 338.59,
- "r_y0": 518.61,
- "r_x1": 352.3,
- "r_y1": 518.61,
- "r_x2": 352.3,
- "r_y2": 486.9,
- "r_x3": 338.59,
- "r_y3": 486.9,
+ "r_x0": 296.67,
+ "r_y0": 277.33,
+ "r_x1": 296.67,
+ "r_y1": 324.33,
+ "r_x2": 312.67,
+ "r_y2": 324.33,
+ "r_x3": 312.67,
+ "r_y3": 277.33,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 10,
@@ -666,21 +741,21 @@
"a": 255
},
"rect": {
- "r_x0": 265.46,
- "r_y0": 207.76,
- "r_x1": 279.18,
- "r_y1": 207.76,
- "r_x2": 279.18,
- "r_y2": 116.78,
- "r_x3": 265.46,
- "r_y3": 116.78,
+ "r_x0": 490.33,
+ "r_y0": 406.33,
+ "r_x1": 490.33,
+ "r_y1": 518.33,
+ "r_x2": 506.33,
+ "r_y2": 518.33,
+ "r_x3": 506.33,
+ "r_y3": 406.33,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 11,
@@ -691,21 +766,21 @@
"a": 255
},
"rect": {
- "r_x0": 265.46,
- "r_y0": 299.73,
- "r_x1": 279.18,
- "r_y1": 299.73,
- "r_x2": 279.18,
- "r_y2": 251.78,
- "r_x3": 265.46,
- "r_y3": 251.78,
+ "r_x0": 459.0,
+ "r_y0": 429.33,
+ "r_x1": 459.0,
+ "r_y1": 499.33,
+ "r_x2": 475.0,
+ "r_y2": 499.33,
+ "r_x3": 475.0,
+ "r_y3": 429.33,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 12,
@@ -716,35 +791,110 @@
"a": 255
},
"rect": {
- "r_x0": 265.46,
- "r_y0": 522.85,
- "r_x1": 279.18,
- "r_y1": 522.85,
- "r_x2": 279.18,
- "r_y2": 484.65,
- "r_x3": 265.46,
- "r_y3": 484.65,
+ "r_x0": 408.0,
+ "r_y0": 408.33,
+ "r_x1": 408.0,
+ "r_y1": 514.0,
+ "r_x2": 424.0,
+ "r_y2": 514.0,
+ "r_x3": 424.0,
+ "r_y3": 408.33,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 376.0,
+ "r_y0": 440.67,
+ "r_x1": 376.0,
+ "r_y1": 487.67,
+ "r_x2": 392.0,
+ "r_y2": 487.67,
+ "r_x3": 392.0,
+ "r_y3": 440.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ },
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 328.0,
+ "r_y0": 408.33,
+ "r_x1": 328.0,
+ "r_y1": 514.0,
+ "r_x2": 344.0,
+ "r_y2": 514.0,
+ "r_x3": 344.0,
+ "r_y3": 408.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 296.67,
+ "r_y0": 440.67,
+ "r_x1": 296.67,
+ "r_y1": 487.67,
+ "r_x2": 312.67,
+ "r_y2": 487.67,
+ "r_x3": 312.67,
+ "r_y3": 440.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": [
{
- "id": 4,
+ "id": 1,
"label": "text",
"bbox": {
- "l": 474.71,
- "t": 245.03,
- "r": 488.43,
- "b": 307.59,
+ "l": 485.67,
+ "t": 97.33,
+ "r": 506.33,
+ "b": 190.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 89.0,
"cells": [
{
"index": 0,
@@ -755,36 +905,36 @@
"a": 255
},
"rect": {
- "r_x0": 474.71,
- "r_y0": 307.59,
- "r_x1": 488.43,
- "r_y1": 307.59,
- "r_x2": 488.43,
- "r_y2": 245.03,
- "r_x3": 474.71,
- "r_y3": 245.03,
+ "r_x0": 485.67,
+ "r_y0": 97.33,
+ "r_x1": 485.67,
+ "r_y1": 190.0,
+ "r_x2": 506.33,
+ "r_y2": 190.0,
+ "r_x3": 506.33,
+ "r_y3": 97.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 89.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 5,
+ "id": 2,
"label": "text",
"bbox": {
- "l": 474.71,
- "t": 358.65,
- "r": 488.43,
- "b": 421.22,
+ "l": 454.33,
+ "t": 112.0,
+ "r": 475.0,
+ "b": 182.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 92.0,
"cells": [
{
"index": 1,
@@ -795,36 +945,36 @@
"a": 255
},
"rect": {
- "r_x0": 474.71,
- "r_y0": 421.22,
- "r_x1": 488.43,
- "r_y1": 421.22,
- "r_x2": 488.43,
- "r_y2": 358.65,
- "r_x3": 474.71,
- "r_y3": 358.65,
+ "r_x0": 454.33,
+ "r_y0": 112.0,
+ "r_x1": 454.33,
+ "r_y1": 182.33,
+ "r_x2": 475.0,
+ "r_y2": 182.33,
+ "r_x3": 475.0,
+ "r_y3": 112.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 6,
+ "id": 3,
"label": "text",
"bbox": {
- "l": 474.71,
- "t": 472.27,
- "r": 488.43,
- "b": 534.84,
+ "l": 392.0,
+ "t": 121.67,
+ "r": 408.0,
+ "b": 168.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 2,
@@ -835,36 +985,36 @@
"a": 255
},
"rect": {
- "r_x0": 474.71,
- "r_y0": 534.84,
- "r_x1": 488.43,
- "r_y1": 534.84,
- "r_x2": 488.43,
- "r_y2": 472.27,
- "r_x3": 474.71,
- "r_y3": 472.27,
+ "r_x0": 392.0,
+ "r_y0": 121.67,
+ "r_x1": 392.0,
+ "r_y1": 168.67,
+ "r_x2": 408.0,
+ "r_y2": 168.67,
+ "r_x3": 408.0,
+ "r_y3": 121.67,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 7,
+ "id": 4,
"label": "text",
"bbox": {
- "l": 407.21,
- "t": 123.53,
- "r": 420.93,
- "b": 200.67,
+ "l": 312.0,
+ "t": 121.67,
+ "r": 328.0,
+ "b": 168.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 3,
@@ -875,36 +1025,36 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 200.67,
- "r_x1": 420.93,
- "r_y1": 200.67,
- "r_x2": 420.93,
- "r_y2": 123.53,
- "r_x3": 407.21,
- "r_y3": 123.53,
+ "r_x0": 312.0,
+ "r_y0": 121.67,
+ "r_x1": 312.0,
+ "r_y1": 168.67,
+ "r_x2": 328.0,
+ "r_y2": 168.67,
+ "r_x3": 328.0,
+ "r_y3": 121.67,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 8,
+ "id": 5,
"label": "text",
"bbox": {
- "l": 407.21,
- "t": 241.65,
- "r": 420.93,
- "b": 310.71,
+ "l": 485.67,
+ "t": 232.67,
+ "r": 506.33,
+ "b": 364.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 92.0,
"cells": [
{
"index": 4,
@@ -915,36 +1065,36 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 310.71,
- "r_x1": 420.93,
- "r_y1": 310.71,
- "r_x2": 420.93,
- "r_y2": 241.65,
- "r_x3": 407.21,
- "r_y3": 241.65,
+ "r_x0": 485.67,
+ "r_y0": 232.67,
+ "r_x1": 485.67,
+ "r_y1": 364.0,
+ "r_x2": 506.33,
+ "r_y2": 364.0,
+ "r_x3": 506.33,
+ "r_y3": 232.67,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 9,
+ "id": 6,
"label": "text",
"bbox": {
- "l": 407.21,
- "t": 347.4,
- "r": 420.93,
- "b": 431.1,
+ "l": 459.0,
+ "t": 265.67,
+ "r": 475.0,
+ "b": 336.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 5,
@@ -955,36 +1105,36 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 431.1,
- "r_x1": 420.93,
- "r_y1": 431.1,
- "r_x2": 420.93,
- "r_y2": 347.4,
- "r_x3": 407.21,
- "r_y3": 347.4,
+ "r_x0": 459.0,
+ "r_y0": 265.67,
+ "r_x1": 459.0,
+ "r_y1": 336.0,
+ "r_x2": 475.0,
+ "r_y2": 336.0,
+ "r_x3": 475.0,
+ "r_y3": 265.67,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 10,
+ "id": 7,
"label": "text",
"bbox": {
- "l": 407.21,
- "t": 491.4,
- "r": 420.93,
- "b": 515.79,
+ "l": 408.0,
+ "t": 247.0,
+ "r": 424.0,
+ "b": 349.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 89.0,
"cells": [
{
"index": 6,
@@ -995,36 +1145,36 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 515.79,
- "r_x1": 420.93,
- "r_y1": 515.79,
- "r_x2": 420.93,
- "r_y2": 491.4,
- "r_x3": 407.21,
- "r_y3": 491.4,
+ "r_x0": 408.0,
+ "r_y0": 247.0,
+ "r_x1": 408.0,
+ "r_y1": 349.67,
+ "r_x2": 424.0,
+ "r_y2": 349.67,
+ "r_x3": 424.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 89.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 11,
+ "id": 8,
"label": "text",
"bbox": {
- "l": 338.59,
- "t": 130.28,
- "r": 352.3,
- "b": 194.46,
+ "l": 376.0,
+ "t": 277.0,
+ "r": 392.0,
+ "b": 324.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 7,
@@ -1035,36 +1185,36 @@
"a": 255
},
"rect": {
- "r_x0": 338.59,
- "r_y0": 194.46,
- "r_x1": 352.3,
- "r_y1": 194.46,
- "r_x2": 352.3,
- "r_y2": 130.28,
- "r_x3": 338.59,
- "r_y3": 130.28,
+ "r_x0": 376.0,
+ "r_y0": 277.0,
+ "r_x1": 376.0,
+ "r_y1": 324.33,
+ "r_x2": 392.0,
+ "r_y2": 324.33,
+ "r_x3": 392.0,
+ "r_y3": 277.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 12,
+ "id": 9,
"label": "text",
"bbox": {
- "l": 338.59,
- "t": 373.27,
- "r": 352.3,
- "b": 406.59,
+ "l": 328.0,
+ "t": 247.0,
+ "r": 344.0,
+ "b": 349.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 8,
@@ -1075,36 +1225,36 @@
"a": 255
},
"rect": {
- "r_x0": 338.59,
- "r_y0": 406.59,
- "r_x1": 352.3,
- "r_y1": 406.59,
- "r_x2": 352.3,
- "r_y2": 373.27,
- "r_x3": 338.59,
- "r_y3": 373.27,
+ "r_x0": 328.0,
+ "r_y0": 247.0,
+ "r_x1": 328.0,
+ "r_y1": 349.67,
+ "r_x2": 344.0,
+ "r_y2": 349.67,
+ "r_x3": 344.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 13,
+ "id": 10,
"label": "text",
"bbox": {
- "l": 338.59,
- "t": 486.9,
- "r": 352.3,
- "b": 518.61,
+ "l": 296.67,
+ "t": 277.33,
+ "r": 312.67,
+ "b": 324.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 9,
@@ -1115,36 +1265,36 @@
"a": 255
},
"rect": {
- "r_x0": 338.59,
- "r_y0": 518.61,
- "r_x1": 352.3,
- "r_y1": 518.61,
- "r_x2": 352.3,
- "r_y2": 486.9,
- "r_x3": 338.59,
- "r_y3": 486.9,
+ "r_x0": 296.67,
+ "r_y0": 277.33,
+ "r_x1": 296.67,
+ "r_y1": 324.33,
+ "r_x2": 312.67,
+ "r_y2": 324.33,
+ "r_x3": 312.67,
+ "r_y3": 277.33,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 14,
+ "id": 11,
"label": "text",
"bbox": {
- "l": 265.46,
- "t": 116.78,
- "r": 279.18,
- "b": 207.76,
+ "l": 490.33,
+ "t": 406.33,
+ "r": 506.33,
+ "b": 518.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 10,
@@ -1155,36 +1305,36 @@
"a": 255
},
"rect": {
- "r_x0": 265.46,
- "r_y0": 207.76,
- "r_x1": 279.18,
- "r_y1": 207.76,
- "r_x2": 279.18,
- "r_y2": 116.78,
- "r_x3": 265.46,
- "r_y3": 116.78,
+ "r_x0": 490.33,
+ "r_y0": 406.33,
+ "r_x1": 490.33,
+ "r_y1": 518.33,
+ "r_x2": 506.33,
+ "r_y2": 518.33,
+ "r_x3": 506.33,
+ "r_y3": 406.33,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 15,
+ "id": 12,
"label": "text",
"bbox": {
- "l": 265.46,
- "t": 251.78,
- "r": 279.18,
- "b": 299.73,
+ "l": 459.0,
+ "t": 429.33,
+ "r": 475.0,
+ "b": 499.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 11,
@@ -1195,36 +1345,36 @@
"a": 255
},
"rect": {
- "r_x0": 265.46,
- "r_y0": 299.73,
- "r_x1": 279.18,
- "r_y1": 299.73,
- "r_x2": 279.18,
- "r_y2": 251.78,
- "r_x3": 265.46,
- "r_y3": 251.78,
+ "r_x0": 459.0,
+ "r_y0": 429.33,
+ "r_x1": 459.0,
+ "r_y1": 499.33,
+ "r_x2": 475.0,
+ "r_y2": 499.33,
+ "r_x3": 475.0,
+ "r_y3": 429.33,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 16,
+ "id": 13,
"label": "text",
"bbox": {
- "l": 265.46,
- "t": 484.65,
- "r": 279.18,
- "b": 522.85,
+ "l": 408.0,
+ "t": 408.33,
+ "r": 424.0,
+ "b": 514.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 12,
@@ -1235,21 +1385,141 @@
"a": 255
},
"rect": {
- "r_x0": 265.46,
- "r_y0": 522.85,
- "r_x1": 279.18,
- "r_y1": 522.85,
- "r_x2": 279.18,
- "r_y2": 484.65,
- "r_x3": 265.46,
- "r_y3": 484.65,
+ "r_x0": 408.0,
+ "r_y0": 408.33,
+ "r_x1": 408.0,
+ "r_y1": 514.0,
+ "r_x2": 424.0,
+ "r_y2": 514.0,
+ "r_x3": 424.0,
+ "r_y3": 408.33,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 14,
+ "label": "text",
+ "bbox": {
+ "l": 376.0,
+ "t": 440.67,
+ "r": 392.0,
+ "b": 487.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 376.0,
+ "r_y0": 440.67,
+ "r_x1": 376.0,
+ "r_y1": 487.67,
+ "r_x2": 392.0,
+ "r_y2": 487.67,
+ "r_x3": 392.0,
+ "r_y3": 440.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 15,
+ "label": "text",
+ "bbox": {
+ "l": 328.0,
+ "t": 408.33,
+ "r": 344.0,
+ "b": 514.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 328.0,
+ "r_y0": 408.33,
+ "r_x1": 328.0,
+ "r_y1": 514.0,
+ "r_x2": 344.0,
+ "r_y2": 514.0,
+ "r_x3": 344.0,
+ "r_y3": 408.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 16,
+ "label": "text",
+ "bbox": {
+ "l": 296.67,
+ "t": 440.67,
+ "r": 312.67,
+ "b": 487.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 296.67,
+ "r_y0": 440.67,
+ "r_x1": 296.67,
+ "r_y1": 487.67,
+ "r_x2": 312.67,
+ "r_y2": 487.67,
+ "r_x3": 312.67,
+ "r_y3": 440.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
@@ -1268,13 +1538,13 @@
"id": 0,
"label": "table",
"bbox": {
- "l": 233.88,
- "t": 102.98,
- "r": 519.9,
- "b": 561.04,
+ "l": 277.42,
+ "t": 69.04,
+ "r": 524.35,
+ "b": 551.1,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.967,
+ "confidence": 0.979,
"cells": [
{
"index": 0,
@@ -1285,21 +1555,21 @@
"a": 255
},
"rect": {
- "r_x0": 474.71,
- "r_y0": 307.59,
- "r_x1": 488.43,
- "r_y1": 307.59,
- "r_x2": 488.43,
- "r_y2": 245.03,
- "r_x3": 474.71,
- "r_y3": 245.03,
+ "r_x0": 485.67,
+ "r_y0": 97.33,
+ "r_x1": 485.67,
+ "r_y1": 190.0,
+ "r_x2": 506.33,
+ "r_y2": 190.0,
+ "r_x3": 506.33,
+ "r_y3": 97.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 89.0,
+ "from_ocr": true
},
{
"index": 1,
@@ -1310,21 +1580,21 @@
"a": 255
},
"rect": {
- "r_x0": 474.71,
- "r_y0": 421.22,
- "r_x1": 488.43,
- "r_y1": 421.22,
- "r_x2": 488.43,
- "r_y2": 358.65,
- "r_x3": 474.71,
- "r_y3": 358.65,
+ "r_x0": 454.33,
+ "r_y0": 112.0,
+ "r_x1": 454.33,
+ "r_y1": 182.33,
+ "r_x2": 475.0,
+ "r_y2": 182.33,
+ "r_x3": 475.0,
+ "r_y3": 112.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 2,
@@ -1335,21 +1605,21 @@
"a": 255
},
"rect": {
- "r_x0": 474.71,
- "r_y0": 534.84,
- "r_x1": 488.43,
- "r_y1": 534.84,
- "r_x2": 488.43,
- "r_y2": 472.27,
- "r_x3": 474.71,
- "r_y3": 472.27,
+ "r_x0": 392.0,
+ "r_y0": 121.67,
+ "r_x1": 392.0,
+ "r_y1": 168.67,
+ "r_x2": 408.0,
+ "r_y2": 168.67,
+ "r_x3": 408.0,
+ "r_y3": 121.67,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 3,
@@ -1360,21 +1630,21 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 200.67,
- "r_x1": 420.93,
- "r_y1": 200.67,
- "r_x2": 420.93,
- "r_y2": 123.53,
- "r_x3": 407.21,
- "r_y3": 123.53,
+ "r_x0": 312.0,
+ "r_y0": 121.67,
+ "r_x1": 312.0,
+ "r_y1": 168.67,
+ "r_x2": 328.0,
+ "r_y2": 168.67,
+ "r_x3": 328.0,
+ "r_y3": 121.67,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 4,
@@ -1385,21 +1655,21 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 310.71,
- "r_x1": 420.93,
- "r_y1": 310.71,
- "r_x2": 420.93,
- "r_y2": 241.65,
- "r_x3": 407.21,
- "r_y3": 241.65,
+ "r_x0": 485.67,
+ "r_y0": 232.67,
+ "r_x1": 485.67,
+ "r_y1": 364.0,
+ "r_x2": 506.33,
+ "r_y2": 364.0,
+ "r_x3": 506.33,
+ "r_y3": 232.67,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 5,
@@ -1410,21 +1680,21 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 431.1,
- "r_x1": 420.93,
- "r_y1": 431.1,
- "r_x2": 420.93,
- "r_y2": 347.4,
- "r_x3": 407.21,
- "r_y3": 347.4,
+ "r_x0": 459.0,
+ "r_y0": 265.67,
+ "r_x1": 459.0,
+ "r_y1": 336.0,
+ "r_x2": 475.0,
+ "r_y2": 336.0,
+ "r_x3": 475.0,
+ "r_y3": 265.67,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 6,
@@ -1435,21 +1705,21 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 515.79,
- "r_x1": 420.93,
- "r_y1": 515.79,
- "r_x2": 420.93,
- "r_y2": 491.4,
- "r_x3": 407.21,
- "r_y3": 491.4,
+ "r_x0": 408.0,
+ "r_y0": 247.0,
+ "r_x1": 408.0,
+ "r_y1": 349.67,
+ "r_x2": 424.0,
+ "r_y2": 349.67,
+ "r_x3": 424.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 89.0,
+ "from_ocr": true
},
{
"index": 7,
@@ -1460,21 +1730,21 @@
"a": 255
},
"rect": {
- "r_x0": 338.59,
- "r_y0": 194.46,
- "r_x1": 352.3,
- "r_y1": 194.46,
- "r_x2": 352.3,
- "r_y2": 130.28,
- "r_x3": 338.59,
- "r_y3": 130.28,
+ "r_x0": 376.0,
+ "r_y0": 277.0,
+ "r_x1": 376.0,
+ "r_y1": 324.33,
+ "r_x2": 392.0,
+ "r_y2": 324.33,
+ "r_x3": 392.0,
+ "r_y3": 277.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 8,
@@ -1485,21 +1755,21 @@
"a": 255
},
"rect": {
- "r_x0": 338.59,
- "r_y0": 406.59,
- "r_x1": 352.3,
- "r_y1": 406.59,
- "r_x2": 352.3,
- "r_y2": 373.27,
- "r_x3": 338.59,
- "r_y3": 373.27,
+ "r_x0": 328.0,
+ "r_y0": 247.0,
+ "r_x1": 328.0,
+ "r_y1": 349.67,
+ "r_x2": 344.0,
+ "r_y2": 349.67,
+ "r_x3": 344.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 9,
@@ -1510,21 +1780,21 @@
"a": 255
},
"rect": {
- "r_x0": 338.59,
- "r_y0": 518.61,
- "r_x1": 352.3,
- "r_y1": 518.61,
- "r_x2": 352.3,
- "r_y2": 486.9,
- "r_x3": 338.59,
- "r_y3": 486.9,
+ "r_x0": 296.67,
+ "r_y0": 277.33,
+ "r_x1": 296.67,
+ "r_y1": 324.33,
+ "r_x2": 312.67,
+ "r_y2": 324.33,
+ "r_x3": 312.67,
+ "r_y3": 277.33,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 10,
@@ -1535,21 +1805,21 @@
"a": 255
},
"rect": {
- "r_x0": 265.46,
- "r_y0": 207.76,
- "r_x1": 279.18,
- "r_y1": 207.76,
- "r_x2": 279.18,
- "r_y2": 116.78,
- "r_x3": 265.46,
- "r_y3": 116.78,
+ "r_x0": 490.33,
+ "r_y0": 406.33,
+ "r_x1": 490.33,
+ "r_y1": 518.33,
+ "r_x2": 506.33,
+ "r_y2": 518.33,
+ "r_x3": 506.33,
+ "r_y3": 406.33,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 11,
@@ -1560,21 +1830,21 @@
"a": 255
},
"rect": {
- "r_x0": 265.46,
- "r_y0": 299.73,
- "r_x1": 279.18,
- "r_y1": 299.73,
- "r_x2": 279.18,
- "r_y2": 251.78,
- "r_x3": 265.46,
- "r_y3": 251.78,
+ "r_x0": 459.0,
+ "r_y0": 429.33,
+ "r_x1": 459.0,
+ "r_y1": 499.33,
+ "r_x2": 475.0,
+ "r_y2": 499.33,
+ "r_x3": 475.0,
+ "r_y3": 429.33,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 12,
@@ -1585,35 +1855,110 @@
"a": 255
},
"rect": {
- "r_x0": 265.46,
- "r_y0": 522.85,
- "r_x1": 279.18,
- "r_y1": 522.85,
- "r_x2": 279.18,
- "r_y2": 484.65,
- "r_x3": 265.46,
- "r_y3": 484.65,
+ "r_x0": 408.0,
+ "r_y0": 408.33,
+ "r_x1": 408.0,
+ "r_y1": 514.0,
+ "r_x2": 424.0,
+ "r_y2": 514.0,
+ "r_x3": 424.0,
+ "r_y3": 408.33,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 376.0,
+ "r_y0": 440.67,
+ "r_x1": 376.0,
+ "r_y1": 487.67,
+ "r_x2": 392.0,
+ "r_y2": 487.67,
+ "r_x3": 392.0,
+ "r_y3": 440.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ },
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 328.0,
+ "r_y0": 408.33,
+ "r_x1": 328.0,
+ "r_y1": 514.0,
+ "r_x2": 344.0,
+ "r_y2": 514.0,
+ "r_x3": 344.0,
+ "r_y3": 408.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 296.67,
+ "r_y0": 440.67,
+ "r_x1": 296.67,
+ "r_y1": 487.67,
+ "r_x2": 312.67,
+ "r_y2": 487.67,
+ "r_x3": 312.67,
+ "r_y3": 440.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": [
{
- "id": 4,
+ "id": 1,
"label": "text",
"bbox": {
- "l": 474.71,
- "t": 245.03,
- "r": 488.43,
- "b": 307.59,
+ "l": 485.67,
+ "t": 97.33,
+ "r": 506.33,
+ "b": 190.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 89.0,
"cells": [
{
"index": 0,
@@ -1624,36 +1969,36 @@
"a": 255
},
"rect": {
- "r_x0": 474.71,
- "r_y0": 307.59,
- "r_x1": 488.43,
- "r_y1": 307.59,
- "r_x2": 488.43,
- "r_y2": 245.03,
- "r_x3": 474.71,
- "r_y3": 245.03,
+ "r_x0": 485.67,
+ "r_y0": 97.33,
+ "r_x1": 485.67,
+ "r_y1": 190.0,
+ "r_x2": 506.33,
+ "r_y2": 190.0,
+ "r_x3": 506.33,
+ "r_y3": 97.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 89.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 5,
+ "id": 2,
"label": "text",
"bbox": {
- "l": 474.71,
- "t": 358.65,
- "r": 488.43,
- "b": 421.22,
+ "l": 454.33,
+ "t": 112.0,
+ "r": 475.0,
+ "b": 182.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 92.0,
"cells": [
{
"index": 1,
@@ -1664,36 +2009,36 @@
"a": 255
},
"rect": {
- "r_x0": 474.71,
- "r_y0": 421.22,
- "r_x1": 488.43,
- "r_y1": 421.22,
- "r_x2": 488.43,
- "r_y2": 358.65,
- "r_x3": 474.71,
- "r_y3": 358.65,
+ "r_x0": 454.33,
+ "r_y0": 112.0,
+ "r_x1": 454.33,
+ "r_y1": 182.33,
+ "r_x2": 475.0,
+ "r_y2": 182.33,
+ "r_x3": 475.0,
+ "r_y3": 112.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 6,
+ "id": 3,
"label": "text",
"bbox": {
- "l": 474.71,
- "t": 472.27,
- "r": 488.43,
- "b": 534.84,
+ "l": 392.0,
+ "t": 121.67,
+ "r": 408.0,
+ "b": 168.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 2,
@@ -1704,36 +2049,36 @@
"a": 255
},
"rect": {
- "r_x0": 474.71,
- "r_y0": 534.84,
- "r_x1": 488.43,
- "r_y1": 534.84,
- "r_x2": 488.43,
- "r_y2": 472.27,
- "r_x3": 474.71,
- "r_y3": 472.27,
+ "r_x0": 392.0,
+ "r_y0": 121.67,
+ "r_x1": 392.0,
+ "r_y1": 168.67,
+ "r_x2": 408.0,
+ "r_y2": 168.67,
+ "r_x3": 408.0,
+ "r_y3": 121.67,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 7,
+ "id": 4,
"label": "text",
"bbox": {
- "l": 407.21,
- "t": 123.53,
- "r": 420.93,
- "b": 200.67,
+ "l": 312.0,
+ "t": 121.67,
+ "r": 328.0,
+ "b": 168.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 3,
@@ -1744,36 +2089,36 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 200.67,
- "r_x1": 420.93,
- "r_y1": 200.67,
- "r_x2": 420.93,
- "r_y2": 123.53,
- "r_x3": 407.21,
- "r_y3": 123.53,
+ "r_x0": 312.0,
+ "r_y0": 121.67,
+ "r_x1": 312.0,
+ "r_y1": 168.67,
+ "r_x2": 328.0,
+ "r_y2": 168.67,
+ "r_x3": 328.0,
+ "r_y3": 121.67,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 8,
+ "id": 5,
"label": "text",
"bbox": {
- "l": 407.21,
- "t": 241.65,
- "r": 420.93,
- "b": 310.71,
+ "l": 485.67,
+ "t": 232.67,
+ "r": 506.33,
+ "b": 364.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 92.0,
"cells": [
{
"index": 4,
@@ -1784,36 +2129,36 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 310.71,
- "r_x1": 420.93,
- "r_y1": 310.71,
- "r_x2": 420.93,
- "r_y2": 241.65,
- "r_x3": 407.21,
- "r_y3": 241.65,
+ "r_x0": 485.67,
+ "r_y0": 232.67,
+ "r_x1": 485.67,
+ "r_y1": 364.0,
+ "r_x2": 506.33,
+ "r_y2": 364.0,
+ "r_x3": 506.33,
+ "r_y3": 232.67,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 9,
+ "id": 6,
"label": "text",
"bbox": {
- "l": 407.21,
- "t": 347.4,
- "r": 420.93,
- "b": 431.1,
+ "l": 459.0,
+ "t": 265.67,
+ "r": 475.0,
+ "b": 336.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 5,
@@ -1824,36 +2169,36 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 431.1,
- "r_x1": 420.93,
- "r_y1": 431.1,
- "r_x2": 420.93,
- "r_y2": 347.4,
- "r_x3": 407.21,
- "r_y3": 347.4,
+ "r_x0": 459.0,
+ "r_y0": 265.67,
+ "r_x1": 459.0,
+ "r_y1": 336.0,
+ "r_x2": 475.0,
+ "r_y2": 336.0,
+ "r_x3": 475.0,
+ "r_y3": 265.67,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 10,
+ "id": 7,
"label": "text",
"bbox": {
- "l": 407.21,
- "t": 491.4,
- "r": 420.93,
- "b": 515.79,
+ "l": 408.0,
+ "t": 247.0,
+ "r": 424.0,
+ "b": 349.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 89.0,
"cells": [
{
"index": 6,
@@ -1864,36 +2209,36 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 515.79,
- "r_x1": 420.93,
- "r_y1": 515.79,
- "r_x2": 420.93,
- "r_y2": 491.4,
- "r_x3": 407.21,
- "r_y3": 491.4,
+ "r_x0": 408.0,
+ "r_y0": 247.0,
+ "r_x1": 408.0,
+ "r_y1": 349.67,
+ "r_x2": 424.0,
+ "r_y2": 349.67,
+ "r_x3": 424.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 89.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 11,
+ "id": 8,
"label": "text",
"bbox": {
- "l": 338.59,
- "t": 130.28,
- "r": 352.3,
- "b": 194.46,
+ "l": 376.0,
+ "t": 277.0,
+ "r": 392.0,
+ "b": 324.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 7,
@@ -1904,36 +2249,36 @@
"a": 255
},
"rect": {
- "r_x0": 338.59,
- "r_y0": 194.46,
- "r_x1": 352.3,
- "r_y1": 194.46,
- "r_x2": 352.3,
- "r_y2": 130.28,
- "r_x3": 338.59,
- "r_y3": 130.28,
+ "r_x0": 376.0,
+ "r_y0": 277.0,
+ "r_x1": 376.0,
+ "r_y1": 324.33,
+ "r_x2": 392.0,
+ "r_y2": 324.33,
+ "r_x3": 392.0,
+ "r_y3": 277.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 12,
+ "id": 9,
"label": "text",
"bbox": {
- "l": 338.59,
- "t": 373.27,
- "r": 352.3,
- "b": 406.59,
+ "l": 328.0,
+ "t": 247.0,
+ "r": 344.0,
+ "b": 349.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 8,
@@ -1944,36 +2289,36 @@
"a": 255
},
"rect": {
- "r_x0": 338.59,
- "r_y0": 406.59,
- "r_x1": 352.3,
- "r_y1": 406.59,
- "r_x2": 352.3,
- "r_y2": 373.27,
- "r_x3": 338.59,
- "r_y3": 373.27,
+ "r_x0": 328.0,
+ "r_y0": 247.0,
+ "r_x1": 328.0,
+ "r_y1": 349.67,
+ "r_x2": 344.0,
+ "r_y2": 349.67,
+ "r_x3": 344.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 13,
+ "id": 10,
"label": "text",
"bbox": {
- "l": 338.59,
- "t": 486.9,
- "r": 352.3,
- "b": 518.61,
+ "l": 296.67,
+ "t": 277.33,
+ "r": 312.67,
+ "b": 324.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 9,
@@ -1984,36 +2329,36 @@
"a": 255
},
"rect": {
- "r_x0": 338.59,
- "r_y0": 518.61,
- "r_x1": 352.3,
- "r_y1": 518.61,
- "r_x2": 352.3,
- "r_y2": 486.9,
- "r_x3": 338.59,
- "r_y3": 486.9,
+ "r_x0": 296.67,
+ "r_y0": 277.33,
+ "r_x1": 296.67,
+ "r_y1": 324.33,
+ "r_x2": 312.67,
+ "r_y2": 324.33,
+ "r_x3": 312.67,
+ "r_y3": 277.33,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 14,
+ "id": 11,
"label": "text",
"bbox": {
- "l": 265.46,
- "t": 116.78,
- "r": 279.18,
- "b": 207.76,
+ "l": 490.33,
+ "t": 406.33,
+ "r": 506.33,
+ "b": 518.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 10,
@@ -2024,36 +2369,36 @@
"a": 255
},
"rect": {
- "r_x0": 265.46,
- "r_y0": 207.76,
- "r_x1": 279.18,
- "r_y1": 207.76,
- "r_x2": 279.18,
- "r_y2": 116.78,
- "r_x3": 265.46,
- "r_y3": 116.78,
+ "r_x0": 490.33,
+ "r_y0": 406.33,
+ "r_x1": 490.33,
+ "r_y1": 518.33,
+ "r_x2": 506.33,
+ "r_y2": 518.33,
+ "r_x3": 506.33,
+ "r_y3": 406.33,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 15,
+ "id": 12,
"label": "text",
"bbox": {
- "l": 265.46,
- "t": 251.78,
- "r": 279.18,
- "b": 299.73,
+ "l": 459.0,
+ "t": 429.33,
+ "r": 475.0,
+ "b": 499.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 11,
@@ -2064,36 +2409,36 @@
"a": 255
},
"rect": {
- "r_x0": 265.46,
- "r_y0": 299.73,
- "r_x1": 279.18,
- "r_y1": 299.73,
- "r_x2": 279.18,
- "r_y2": 251.78,
- "r_x3": 265.46,
- "r_y3": 251.78,
+ "r_x0": 459.0,
+ "r_y0": 429.33,
+ "r_x1": 459.0,
+ "r_y1": 499.33,
+ "r_x2": 475.0,
+ "r_y2": 499.33,
+ "r_x3": 475.0,
+ "r_y3": 429.33,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 16,
+ "id": 13,
"label": "text",
"bbox": {
- "l": 265.46,
- "t": 484.65,
- "r": 279.18,
- "b": 522.85,
+ "l": 408.0,
+ "t": 408.33,
+ "r": 424.0,
+ "b": 514.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 12,
@@ -2104,21 +2449,141 @@
"a": 255
},
"rect": {
- "r_x0": 265.46,
- "r_y0": 522.85,
- "r_x1": 279.18,
- "r_y1": 522.85,
- "r_x2": 279.18,
- "r_y2": 484.65,
- "r_x3": 265.46,
- "r_y3": 484.65,
+ "r_x0": 408.0,
+ "r_y0": 408.33,
+ "r_x1": 408.0,
+ "r_y1": 514.0,
+ "r_x2": 424.0,
+ "r_y2": 514.0,
+ "r_x3": 424.0,
+ "r_y3": 408.33,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 14,
+ "label": "text",
+ "bbox": {
+ "l": 376.0,
+ "t": 440.67,
+ "r": 392.0,
+ "b": 487.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 376.0,
+ "r_y0": 440.67,
+ "r_x1": 376.0,
+ "r_y1": 487.67,
+ "r_x2": 392.0,
+ "r_y2": 487.67,
+ "r_x3": 392.0,
+ "r_y3": 440.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 15,
+ "label": "text",
+ "bbox": {
+ "l": 328.0,
+ "t": 408.33,
+ "r": 344.0,
+ "b": 514.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 328.0,
+ "r_y0": 408.33,
+ "r_x1": 328.0,
+ "r_y1": 514.0,
+ "r_x2": 344.0,
+ "r_y2": 514.0,
+ "r_x3": 344.0,
+ "r_y3": 408.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 16,
+ "label": "text",
+ "bbox": {
+ "l": 296.67,
+ "t": 440.67,
+ "r": 312.67,
+ "b": 487.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 296.67,
+ "r_y0": 440.67,
+ "r_x1": 296.67,
+ "r_y1": 487.67,
+ "r_x2": 312.67,
+ "r_y2": 487.67,
+ "r_x3": 312.67,
+ "r_y3": 440.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
@@ -2127,93 +2592,28 @@
},
"text": null,
"otsl_seq": [
- "fcel",
- "fcel",
- "fcel",
- "ecel",
+ "ched",
+ "ched",
+ "ched",
"nl",
"fcel",
- "ecel",
- "fcel",
- "fcel",
- "nl",
- "ecel",
- "fcel",
"fcel",
"fcel",
"nl",
"fcel",
"fcel",
"fcel",
- "fcel",
"nl"
],
- "num_rows": 4,
- "num_cols": 4,
+ "num_rows": 1,
+ "num_cols": 3,
"table_cells": [
{
"bbox": {
- "l": 474.71,
- "t": 245.03,
- "r": 488.43,
- "b": 307.59,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "Column 0",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 474.71,
- "t": 358.65,
- "r": 488.43,
- "b": 421.22,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "Column 1",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 474.71,
- "t": 472.27,
- "r": 488.43,
- "b": 534.84,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "Column 2",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 407.21,
- "t": 123.53,
- "r": 420.93,
- "b": 200.67,
+ "l": 443.33,
+ "t": 312.0,
+ "r": 490.33,
+ "b": 328.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -2222,74 +2622,17 @@
"end_row_offset_idx": 1,
"start_col_offset_idx": 2,
"end_col_offset_idx": 3,
- "text": "this is row 0",
+ "text": "value",
"column_header": false,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 407.21,
- "t": 241.65,
- "r": 420.93,
- "b": 310.71,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "some cells",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 407.21,
- "t": 347.4,
- "r": 420.93,
- "b": 431.1,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "have content",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 407.21,
- "t": 491.4,
- "r": 420.93,
- "b": 515.79,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "and",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 338.59,
- "t": 130.28,
- "r": 352.3,
- "b": 194.46,
+ "l": 262.33,
+ "t": 296.67,
+ "r": 365.0,
+ "b": 344.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -2298,55 +2641,17 @@
"end_row_offset_idx": 1,
"start_col_offset_idx": 1,
"end_col_offset_idx": 2,
- "text": "and row 1",
+ "text": "Some other value",
"column_header": false,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 338.59,
- "t": 373.27,
- "r": 352.3,
- "b": 406.59,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "other",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 338.59,
- "t": 486.9,
- "r": 352.3,
- "b": 518.61,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "have",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 265.46,
- "t": 116.78,
- "r": 279.18,
- "b": 207.76,
+ "l": 98.0,
+ "t": 296.67,
+ "r": 203.67,
+ "b": 344.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -2355,45 +2660,7 @@
"end_row_offset_idx": 1,
"start_col_offset_idx": 0,
"end_col_offset_idx": 1,
- "text": "and last row 2",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 265.46,
- "t": 251.78,
- "r": 279.18,
- "b": 299.73,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "nothing",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 265.46,
- "t": 484.65,
- "r": 279.18,
- "b": 522.85,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "inside",
+ "text": "Yet another value",
"column_header": false,
"row_header": false,
"row_section": false
@@ -2416,13 +2683,13 @@
"id": 0,
"label": "table",
"bbox": {
- "l": 233.88,
- "t": 102.98,
- "r": 519.9,
- "b": 561.04,
+ "l": 277.42,
+ "t": 69.04,
+ "r": 524.35,
+ "b": 551.1,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.967,
+ "confidence": 0.979,
"cells": [
{
"index": 0,
@@ -2433,21 +2700,21 @@
"a": 255
},
"rect": {
- "r_x0": 474.71,
- "r_y0": 307.59,
- "r_x1": 488.43,
- "r_y1": 307.59,
- "r_x2": 488.43,
- "r_y2": 245.03,
- "r_x3": 474.71,
- "r_y3": 245.03,
+ "r_x0": 485.67,
+ "r_y0": 97.33,
+ "r_x1": 485.67,
+ "r_y1": 190.0,
+ "r_x2": 506.33,
+ "r_y2": 190.0,
+ "r_x3": 506.33,
+ "r_y3": 97.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 89.0,
+ "from_ocr": true
},
{
"index": 1,
@@ -2458,21 +2725,21 @@
"a": 255
},
"rect": {
- "r_x0": 474.71,
- "r_y0": 421.22,
- "r_x1": 488.43,
- "r_y1": 421.22,
- "r_x2": 488.43,
- "r_y2": 358.65,
- "r_x3": 474.71,
- "r_y3": 358.65,
+ "r_x0": 454.33,
+ "r_y0": 112.0,
+ "r_x1": 454.33,
+ "r_y1": 182.33,
+ "r_x2": 475.0,
+ "r_y2": 182.33,
+ "r_x3": 475.0,
+ "r_y3": 112.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 2,
@@ -2483,21 +2750,21 @@
"a": 255
},
"rect": {
- "r_x0": 474.71,
- "r_y0": 534.84,
- "r_x1": 488.43,
- "r_y1": 534.84,
- "r_x2": 488.43,
- "r_y2": 472.27,
- "r_x3": 474.71,
- "r_y3": 472.27,
+ "r_x0": 392.0,
+ "r_y0": 121.67,
+ "r_x1": 392.0,
+ "r_y1": 168.67,
+ "r_x2": 408.0,
+ "r_y2": 168.67,
+ "r_x3": 408.0,
+ "r_y3": 121.67,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 3,
@@ -2508,21 +2775,21 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 200.67,
- "r_x1": 420.93,
- "r_y1": 200.67,
- "r_x2": 420.93,
- "r_y2": 123.53,
- "r_x3": 407.21,
- "r_y3": 123.53,
+ "r_x0": 312.0,
+ "r_y0": 121.67,
+ "r_x1": 312.0,
+ "r_y1": 168.67,
+ "r_x2": 328.0,
+ "r_y2": 168.67,
+ "r_x3": 328.0,
+ "r_y3": 121.67,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 4,
@@ -2533,21 +2800,21 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 310.71,
- "r_x1": 420.93,
- "r_y1": 310.71,
- "r_x2": 420.93,
- "r_y2": 241.65,
- "r_x3": 407.21,
- "r_y3": 241.65,
+ "r_x0": 485.67,
+ "r_y0": 232.67,
+ "r_x1": 485.67,
+ "r_y1": 364.0,
+ "r_x2": 506.33,
+ "r_y2": 364.0,
+ "r_x3": 506.33,
+ "r_y3": 232.67,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 5,
@@ -2558,21 +2825,21 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 431.1,
- "r_x1": 420.93,
- "r_y1": 431.1,
- "r_x2": 420.93,
- "r_y2": 347.4,
- "r_x3": 407.21,
- "r_y3": 347.4,
+ "r_x0": 459.0,
+ "r_y0": 265.67,
+ "r_x1": 459.0,
+ "r_y1": 336.0,
+ "r_x2": 475.0,
+ "r_y2": 336.0,
+ "r_x3": 475.0,
+ "r_y3": 265.67,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 6,
@@ -2583,21 +2850,21 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 515.79,
- "r_x1": 420.93,
- "r_y1": 515.79,
- "r_x2": 420.93,
- "r_y2": 491.4,
- "r_x3": 407.21,
- "r_y3": 491.4,
+ "r_x0": 408.0,
+ "r_y0": 247.0,
+ "r_x1": 408.0,
+ "r_y1": 349.67,
+ "r_x2": 424.0,
+ "r_y2": 349.67,
+ "r_x3": 424.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 89.0,
+ "from_ocr": true
},
{
"index": 7,
@@ -2608,21 +2875,21 @@
"a": 255
},
"rect": {
- "r_x0": 338.59,
- "r_y0": 194.46,
- "r_x1": 352.3,
- "r_y1": 194.46,
- "r_x2": 352.3,
- "r_y2": 130.28,
- "r_x3": 338.59,
- "r_y3": 130.28,
+ "r_x0": 376.0,
+ "r_y0": 277.0,
+ "r_x1": 376.0,
+ "r_y1": 324.33,
+ "r_x2": 392.0,
+ "r_y2": 324.33,
+ "r_x3": 392.0,
+ "r_y3": 277.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 8,
@@ -2633,21 +2900,21 @@
"a": 255
},
"rect": {
- "r_x0": 338.59,
- "r_y0": 406.59,
- "r_x1": 352.3,
- "r_y1": 406.59,
- "r_x2": 352.3,
- "r_y2": 373.27,
- "r_x3": 338.59,
- "r_y3": 373.27,
+ "r_x0": 328.0,
+ "r_y0": 247.0,
+ "r_x1": 328.0,
+ "r_y1": 349.67,
+ "r_x2": 344.0,
+ "r_y2": 349.67,
+ "r_x3": 344.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 9,
@@ -2658,21 +2925,21 @@
"a": 255
},
"rect": {
- "r_x0": 338.59,
- "r_y0": 518.61,
- "r_x1": 352.3,
- "r_y1": 518.61,
- "r_x2": 352.3,
- "r_y2": 486.9,
- "r_x3": 338.59,
- "r_y3": 486.9,
+ "r_x0": 296.67,
+ "r_y0": 277.33,
+ "r_x1": 296.67,
+ "r_y1": 324.33,
+ "r_x2": 312.67,
+ "r_y2": 324.33,
+ "r_x3": 312.67,
+ "r_y3": 277.33,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 10,
@@ -2683,21 +2950,21 @@
"a": 255
},
"rect": {
- "r_x0": 265.46,
- "r_y0": 207.76,
- "r_x1": 279.18,
- "r_y1": 207.76,
- "r_x2": 279.18,
- "r_y2": 116.78,
- "r_x3": 265.46,
- "r_y3": 116.78,
+ "r_x0": 490.33,
+ "r_y0": 406.33,
+ "r_x1": 490.33,
+ "r_y1": 518.33,
+ "r_x2": 506.33,
+ "r_y2": 518.33,
+ "r_x3": 506.33,
+ "r_y3": 406.33,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 11,
@@ -2708,21 +2975,21 @@
"a": 255
},
"rect": {
- "r_x0": 265.46,
- "r_y0": 299.73,
- "r_x1": 279.18,
- "r_y1": 299.73,
- "r_x2": 279.18,
- "r_y2": 251.78,
- "r_x3": 265.46,
- "r_y3": 251.78,
+ "r_x0": 459.0,
+ "r_y0": 429.33,
+ "r_x1": 459.0,
+ "r_y1": 499.33,
+ "r_x2": 475.0,
+ "r_y2": 499.33,
+ "r_x3": 475.0,
+ "r_y3": 429.33,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 12,
@@ -2733,35 +3000,110 @@
"a": 255
},
"rect": {
- "r_x0": 265.46,
- "r_y0": 522.85,
- "r_x1": 279.18,
- "r_y1": 522.85,
- "r_x2": 279.18,
- "r_y2": 484.65,
- "r_x3": 265.46,
- "r_y3": 484.65,
+ "r_x0": 408.0,
+ "r_y0": 408.33,
+ "r_x1": 408.0,
+ "r_y1": 514.0,
+ "r_x2": 424.0,
+ "r_y2": 514.0,
+ "r_x3": 424.0,
+ "r_y3": 408.33,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 376.0,
+ "r_y0": 440.67,
+ "r_x1": 376.0,
+ "r_y1": 487.67,
+ "r_x2": 392.0,
+ "r_y2": 487.67,
+ "r_x3": 392.0,
+ "r_y3": 440.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ },
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 328.0,
+ "r_y0": 408.33,
+ "r_x1": 328.0,
+ "r_y1": 514.0,
+ "r_x2": 344.0,
+ "r_y2": 514.0,
+ "r_x3": 344.0,
+ "r_y3": 408.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 296.67,
+ "r_y0": 440.67,
+ "r_x1": 296.67,
+ "r_y1": 487.67,
+ "r_x2": 312.67,
+ "r_y2": 487.67,
+ "r_x3": 312.67,
+ "r_y3": 440.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": [
{
- "id": 4,
+ "id": 1,
"label": "text",
"bbox": {
- "l": 474.71,
- "t": 245.03,
- "r": 488.43,
- "b": 307.59,
+ "l": 485.67,
+ "t": 97.33,
+ "r": 506.33,
+ "b": 190.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 89.0,
"cells": [
{
"index": 0,
@@ -2772,36 +3114,36 @@
"a": 255
},
"rect": {
- "r_x0": 474.71,
- "r_y0": 307.59,
- "r_x1": 488.43,
- "r_y1": 307.59,
- "r_x2": 488.43,
- "r_y2": 245.03,
- "r_x3": 474.71,
- "r_y3": 245.03,
+ "r_x0": 485.67,
+ "r_y0": 97.33,
+ "r_x1": 485.67,
+ "r_y1": 190.0,
+ "r_x2": 506.33,
+ "r_y2": 190.0,
+ "r_x3": 506.33,
+ "r_y3": 97.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 89.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 5,
+ "id": 2,
"label": "text",
"bbox": {
- "l": 474.71,
- "t": 358.65,
- "r": 488.43,
- "b": 421.22,
+ "l": 454.33,
+ "t": 112.0,
+ "r": 475.0,
+ "b": 182.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 92.0,
"cells": [
{
"index": 1,
@@ -2812,36 +3154,36 @@
"a": 255
},
"rect": {
- "r_x0": 474.71,
- "r_y0": 421.22,
- "r_x1": 488.43,
- "r_y1": 421.22,
- "r_x2": 488.43,
- "r_y2": 358.65,
- "r_x3": 474.71,
- "r_y3": 358.65,
+ "r_x0": 454.33,
+ "r_y0": 112.0,
+ "r_x1": 454.33,
+ "r_y1": 182.33,
+ "r_x2": 475.0,
+ "r_y2": 182.33,
+ "r_x3": 475.0,
+ "r_y3": 112.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 6,
+ "id": 3,
"label": "text",
"bbox": {
- "l": 474.71,
- "t": 472.27,
- "r": 488.43,
- "b": 534.84,
+ "l": 392.0,
+ "t": 121.67,
+ "r": 408.0,
+ "b": 168.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 2,
@@ -2852,36 +3194,36 @@
"a": 255
},
"rect": {
- "r_x0": 474.71,
- "r_y0": 534.84,
- "r_x1": 488.43,
- "r_y1": 534.84,
- "r_x2": 488.43,
- "r_y2": 472.27,
- "r_x3": 474.71,
- "r_y3": 472.27,
+ "r_x0": 392.0,
+ "r_y0": 121.67,
+ "r_x1": 392.0,
+ "r_y1": 168.67,
+ "r_x2": 408.0,
+ "r_y2": 168.67,
+ "r_x3": 408.0,
+ "r_y3": 121.67,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 7,
+ "id": 4,
"label": "text",
"bbox": {
- "l": 407.21,
- "t": 123.53,
- "r": 420.93,
- "b": 200.67,
+ "l": 312.0,
+ "t": 121.67,
+ "r": 328.0,
+ "b": 168.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 3,
@@ -2892,36 +3234,36 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 200.67,
- "r_x1": 420.93,
- "r_y1": 200.67,
- "r_x2": 420.93,
- "r_y2": 123.53,
- "r_x3": 407.21,
- "r_y3": 123.53,
+ "r_x0": 312.0,
+ "r_y0": 121.67,
+ "r_x1": 312.0,
+ "r_y1": 168.67,
+ "r_x2": 328.0,
+ "r_y2": 168.67,
+ "r_x3": 328.0,
+ "r_y3": 121.67,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 8,
+ "id": 5,
"label": "text",
"bbox": {
- "l": 407.21,
- "t": 241.65,
- "r": 420.93,
- "b": 310.71,
+ "l": 485.67,
+ "t": 232.67,
+ "r": 506.33,
+ "b": 364.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 92.0,
"cells": [
{
"index": 4,
@@ -2932,36 +3274,36 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 310.71,
- "r_x1": 420.93,
- "r_y1": 310.71,
- "r_x2": 420.93,
- "r_y2": 241.65,
- "r_x3": 407.21,
- "r_y3": 241.65,
+ "r_x0": 485.67,
+ "r_y0": 232.67,
+ "r_x1": 485.67,
+ "r_y1": 364.0,
+ "r_x2": 506.33,
+ "r_y2": 364.0,
+ "r_x3": 506.33,
+ "r_y3": 232.67,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 9,
+ "id": 6,
"label": "text",
"bbox": {
- "l": 407.21,
- "t": 347.4,
- "r": 420.93,
- "b": 431.1,
+ "l": 459.0,
+ "t": 265.67,
+ "r": 475.0,
+ "b": 336.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 5,
@@ -2972,36 +3314,36 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 431.1,
- "r_x1": 420.93,
- "r_y1": 431.1,
- "r_x2": 420.93,
- "r_y2": 347.4,
- "r_x3": 407.21,
- "r_y3": 347.4,
+ "r_x0": 459.0,
+ "r_y0": 265.67,
+ "r_x1": 459.0,
+ "r_y1": 336.0,
+ "r_x2": 475.0,
+ "r_y2": 336.0,
+ "r_x3": 475.0,
+ "r_y3": 265.67,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 10,
+ "id": 7,
"label": "text",
"bbox": {
- "l": 407.21,
- "t": 491.4,
- "r": 420.93,
- "b": 515.79,
+ "l": 408.0,
+ "t": 247.0,
+ "r": 424.0,
+ "b": 349.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 89.0,
"cells": [
{
"index": 6,
@@ -3012,36 +3354,36 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 515.79,
- "r_x1": 420.93,
- "r_y1": 515.79,
- "r_x2": 420.93,
- "r_y2": 491.4,
- "r_x3": 407.21,
- "r_y3": 491.4,
+ "r_x0": 408.0,
+ "r_y0": 247.0,
+ "r_x1": 408.0,
+ "r_y1": 349.67,
+ "r_x2": 424.0,
+ "r_y2": 349.67,
+ "r_x3": 424.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 89.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 11,
+ "id": 8,
"label": "text",
"bbox": {
- "l": 338.59,
- "t": 130.28,
- "r": 352.3,
- "b": 194.46,
+ "l": 376.0,
+ "t": 277.0,
+ "r": 392.0,
+ "b": 324.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 7,
@@ -3052,36 +3394,36 @@
"a": 255
},
"rect": {
- "r_x0": 338.59,
- "r_y0": 194.46,
- "r_x1": 352.3,
- "r_y1": 194.46,
- "r_x2": 352.3,
- "r_y2": 130.28,
- "r_x3": 338.59,
- "r_y3": 130.28,
+ "r_x0": 376.0,
+ "r_y0": 277.0,
+ "r_x1": 376.0,
+ "r_y1": 324.33,
+ "r_x2": 392.0,
+ "r_y2": 324.33,
+ "r_x3": 392.0,
+ "r_y3": 277.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 12,
+ "id": 9,
"label": "text",
"bbox": {
- "l": 338.59,
- "t": 373.27,
- "r": 352.3,
- "b": 406.59,
+ "l": 328.0,
+ "t": 247.0,
+ "r": 344.0,
+ "b": 349.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 8,
@@ -3092,36 +3434,36 @@
"a": 255
},
"rect": {
- "r_x0": 338.59,
- "r_y0": 406.59,
- "r_x1": 352.3,
- "r_y1": 406.59,
- "r_x2": 352.3,
- "r_y2": 373.27,
- "r_x3": 338.59,
- "r_y3": 373.27,
+ "r_x0": 328.0,
+ "r_y0": 247.0,
+ "r_x1": 328.0,
+ "r_y1": 349.67,
+ "r_x2": 344.0,
+ "r_y2": 349.67,
+ "r_x3": 344.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 13,
+ "id": 10,
"label": "text",
"bbox": {
- "l": 338.59,
- "t": 486.9,
- "r": 352.3,
- "b": 518.61,
+ "l": 296.67,
+ "t": 277.33,
+ "r": 312.67,
+ "b": 324.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 9,
@@ -3132,36 +3474,36 @@
"a": 255
},
"rect": {
- "r_x0": 338.59,
- "r_y0": 518.61,
- "r_x1": 352.3,
- "r_y1": 518.61,
- "r_x2": 352.3,
- "r_y2": 486.9,
- "r_x3": 338.59,
- "r_y3": 486.9,
+ "r_x0": 296.67,
+ "r_y0": 277.33,
+ "r_x1": 296.67,
+ "r_y1": 324.33,
+ "r_x2": 312.67,
+ "r_y2": 324.33,
+ "r_x3": 312.67,
+ "r_y3": 277.33,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 14,
+ "id": 11,
"label": "text",
"bbox": {
- "l": 265.46,
- "t": 116.78,
- "r": 279.18,
- "b": 207.76,
+ "l": 490.33,
+ "t": 406.33,
+ "r": 506.33,
+ "b": 518.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 10,
@@ -3172,36 +3514,36 @@
"a": 255
},
"rect": {
- "r_x0": 265.46,
- "r_y0": 207.76,
- "r_x1": 279.18,
- "r_y1": 207.76,
- "r_x2": 279.18,
- "r_y2": 116.78,
- "r_x3": 265.46,
- "r_y3": 116.78,
+ "r_x0": 490.33,
+ "r_y0": 406.33,
+ "r_x1": 490.33,
+ "r_y1": 518.33,
+ "r_x2": 506.33,
+ "r_y2": 518.33,
+ "r_x3": 506.33,
+ "r_y3": 406.33,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 15,
+ "id": 12,
"label": "text",
"bbox": {
- "l": 265.46,
- "t": 251.78,
- "r": 279.18,
- "b": 299.73,
+ "l": 459.0,
+ "t": 429.33,
+ "r": 475.0,
+ "b": 499.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 11,
@@ -3212,36 +3554,36 @@
"a": 255
},
"rect": {
- "r_x0": 265.46,
- "r_y0": 299.73,
- "r_x1": 279.18,
- "r_y1": 299.73,
- "r_x2": 279.18,
- "r_y2": 251.78,
- "r_x3": 265.46,
- "r_y3": 251.78,
+ "r_x0": 459.0,
+ "r_y0": 429.33,
+ "r_x1": 459.0,
+ "r_y1": 499.33,
+ "r_x2": 475.0,
+ "r_y2": 499.33,
+ "r_x3": 475.0,
+ "r_y3": 429.33,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 16,
+ "id": 13,
"label": "text",
"bbox": {
- "l": 265.46,
- "t": 484.65,
- "r": 279.18,
- "b": 522.85,
+ "l": 408.0,
+ "t": 408.33,
+ "r": 424.0,
+ "b": 514.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 12,
@@ -3252,21 +3594,141 @@
"a": 255
},
"rect": {
- "r_x0": 265.46,
- "r_y0": 522.85,
- "r_x1": 279.18,
- "r_y1": 522.85,
- "r_x2": 279.18,
- "r_y2": 484.65,
- "r_x3": 265.46,
- "r_y3": 484.65,
+ "r_x0": 408.0,
+ "r_y0": 408.33,
+ "r_x1": 408.0,
+ "r_y1": 514.0,
+ "r_x2": 424.0,
+ "r_y2": 514.0,
+ "r_x3": 424.0,
+ "r_y3": 408.33,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 14,
+ "label": "text",
+ "bbox": {
+ "l": 376.0,
+ "t": 440.67,
+ "r": 392.0,
+ "b": 487.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 376.0,
+ "r_y0": 440.67,
+ "r_x1": 376.0,
+ "r_y1": 487.67,
+ "r_x2": 392.0,
+ "r_y2": 487.67,
+ "r_x3": 392.0,
+ "r_y3": 440.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 15,
+ "label": "text",
+ "bbox": {
+ "l": 328.0,
+ "t": 408.33,
+ "r": 344.0,
+ "b": 514.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 328.0,
+ "r_y0": 408.33,
+ "r_x1": 328.0,
+ "r_y1": 514.0,
+ "r_x2": 344.0,
+ "r_y2": 514.0,
+ "r_x3": 344.0,
+ "r_y3": 408.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 16,
+ "label": "text",
+ "bbox": {
+ "l": 296.67,
+ "t": 440.67,
+ "r": 312.67,
+ "b": 487.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 296.67,
+ "r_y0": 440.67,
+ "r_x1": 296.67,
+ "r_y1": 487.67,
+ "r_x2": 312.67,
+ "r_y2": 487.67,
+ "r_x3": 312.67,
+ "r_y3": 440.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
@@ -3275,93 +3737,28 @@
},
"text": null,
"otsl_seq": [
- "fcel",
- "fcel",
- "fcel",
- "ecel",
+ "ched",
+ "ched",
+ "ched",
"nl",
"fcel",
- "ecel",
- "fcel",
- "fcel",
- "nl",
- "ecel",
- "fcel",
"fcel",
"fcel",
"nl",
"fcel",
"fcel",
"fcel",
- "fcel",
"nl"
],
- "num_rows": 4,
- "num_cols": 4,
+ "num_rows": 1,
+ "num_cols": 3,
"table_cells": [
{
"bbox": {
- "l": 474.71,
- "t": 245.03,
- "r": 488.43,
- "b": 307.59,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "Column 0",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 474.71,
- "t": 358.65,
- "r": 488.43,
- "b": 421.22,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "Column 1",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 474.71,
- "t": 472.27,
- "r": 488.43,
- "b": 534.84,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "Column 2",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 407.21,
- "t": 123.53,
- "r": 420.93,
- "b": 200.67,
+ "l": 443.33,
+ "t": 312.0,
+ "r": 490.33,
+ "b": 328.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -3370,74 +3767,17 @@
"end_row_offset_idx": 1,
"start_col_offset_idx": 2,
"end_col_offset_idx": 3,
- "text": "this is row 0",
+ "text": "value",
"column_header": false,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 407.21,
- "t": 241.65,
- "r": 420.93,
- "b": 310.71,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "some cells",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 407.21,
- "t": 347.4,
- "r": 420.93,
- "b": 431.1,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "have content",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 407.21,
- "t": 491.4,
- "r": 420.93,
- "b": 515.79,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "and",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 338.59,
- "t": 130.28,
- "r": 352.3,
- "b": 194.46,
+ "l": 262.33,
+ "t": 296.67,
+ "r": 365.0,
+ "b": 344.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -3446,55 +3786,17 @@
"end_row_offset_idx": 1,
"start_col_offset_idx": 1,
"end_col_offset_idx": 2,
- "text": "and row 1",
+ "text": "Some other value",
"column_header": false,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 338.59,
- "t": 373.27,
- "r": 352.3,
- "b": 406.59,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "other",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 338.59,
- "t": 486.9,
- "r": 352.3,
- "b": 518.61,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "have",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 265.46,
- "t": 116.78,
- "r": 279.18,
- "b": 207.76,
+ "l": 98.0,
+ "t": 296.67,
+ "r": 203.67,
+ "b": 344.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -3503,45 +3805,7 @@
"end_row_offset_idx": 1,
"start_col_offset_idx": 0,
"end_col_offset_idx": 1,
- "text": "and last row 2",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 265.46,
- "t": 251.78,
- "r": 279.18,
- "b": 299.73,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "nothing",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 265.46,
- "t": 484.65,
- "r": 279.18,
- "b": 522.85,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "inside",
+ "text": "Yet another value",
"column_header": false,
"row_header": false,
"row_section": false
@@ -3558,13 +3822,13 @@
"id": 0,
"label": "table",
"bbox": {
- "l": 233.88,
- "t": 102.98,
- "r": 519.9,
- "b": 561.04,
+ "l": 277.42,
+ "t": 69.04,
+ "r": 524.35,
+ "b": 551.1,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.967,
+ "confidence": 0.979,
"cells": [
{
"index": 0,
@@ -3575,21 +3839,21 @@
"a": 255
},
"rect": {
- "r_x0": 474.71,
- "r_y0": 307.59,
- "r_x1": 488.43,
- "r_y1": 307.59,
- "r_x2": 488.43,
- "r_y2": 245.03,
- "r_x3": 474.71,
- "r_y3": 245.03,
+ "r_x0": 485.67,
+ "r_y0": 97.33,
+ "r_x1": 485.67,
+ "r_y1": 190.0,
+ "r_x2": 506.33,
+ "r_y2": 190.0,
+ "r_x3": 506.33,
+ "r_y3": 97.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 89.0,
+ "from_ocr": true
},
{
"index": 1,
@@ -3600,21 +3864,21 @@
"a": 255
},
"rect": {
- "r_x0": 474.71,
- "r_y0": 421.22,
- "r_x1": 488.43,
- "r_y1": 421.22,
- "r_x2": 488.43,
- "r_y2": 358.65,
- "r_x3": 474.71,
- "r_y3": 358.65,
+ "r_x0": 454.33,
+ "r_y0": 112.0,
+ "r_x1": 454.33,
+ "r_y1": 182.33,
+ "r_x2": 475.0,
+ "r_y2": 182.33,
+ "r_x3": 475.0,
+ "r_y3": 112.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 2,
@@ -3625,21 +3889,21 @@
"a": 255
},
"rect": {
- "r_x0": 474.71,
- "r_y0": 534.84,
- "r_x1": 488.43,
- "r_y1": 534.84,
- "r_x2": 488.43,
- "r_y2": 472.27,
- "r_x3": 474.71,
- "r_y3": 472.27,
+ "r_x0": 392.0,
+ "r_y0": 121.67,
+ "r_x1": 392.0,
+ "r_y1": 168.67,
+ "r_x2": 408.0,
+ "r_y2": 168.67,
+ "r_x3": 408.0,
+ "r_y3": 121.67,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 3,
@@ -3650,21 +3914,21 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 200.67,
- "r_x1": 420.93,
- "r_y1": 200.67,
- "r_x2": 420.93,
- "r_y2": 123.53,
- "r_x3": 407.21,
- "r_y3": 123.53,
+ "r_x0": 312.0,
+ "r_y0": 121.67,
+ "r_x1": 312.0,
+ "r_y1": 168.67,
+ "r_x2": 328.0,
+ "r_y2": 168.67,
+ "r_x3": 328.0,
+ "r_y3": 121.67,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 4,
@@ -3675,21 +3939,21 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 310.71,
- "r_x1": 420.93,
- "r_y1": 310.71,
- "r_x2": 420.93,
- "r_y2": 241.65,
- "r_x3": 407.21,
- "r_y3": 241.65,
+ "r_x0": 485.67,
+ "r_y0": 232.67,
+ "r_x1": 485.67,
+ "r_y1": 364.0,
+ "r_x2": 506.33,
+ "r_y2": 364.0,
+ "r_x3": 506.33,
+ "r_y3": 232.67,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 5,
@@ -3700,21 +3964,21 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 431.1,
- "r_x1": 420.93,
- "r_y1": 431.1,
- "r_x2": 420.93,
- "r_y2": 347.4,
- "r_x3": 407.21,
- "r_y3": 347.4,
+ "r_x0": 459.0,
+ "r_y0": 265.67,
+ "r_x1": 459.0,
+ "r_y1": 336.0,
+ "r_x2": 475.0,
+ "r_y2": 336.0,
+ "r_x3": 475.0,
+ "r_y3": 265.67,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 6,
@@ -3725,21 +3989,21 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 515.79,
- "r_x1": 420.93,
- "r_y1": 515.79,
- "r_x2": 420.93,
- "r_y2": 491.4,
- "r_x3": 407.21,
- "r_y3": 491.4,
+ "r_x0": 408.0,
+ "r_y0": 247.0,
+ "r_x1": 408.0,
+ "r_y1": 349.67,
+ "r_x2": 424.0,
+ "r_y2": 349.67,
+ "r_x3": 424.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 89.0,
+ "from_ocr": true
},
{
"index": 7,
@@ -3750,21 +4014,21 @@
"a": 255
},
"rect": {
- "r_x0": 338.59,
- "r_y0": 194.46,
- "r_x1": 352.3,
- "r_y1": 194.46,
- "r_x2": 352.3,
- "r_y2": 130.28,
- "r_x3": 338.59,
- "r_y3": 130.28,
+ "r_x0": 376.0,
+ "r_y0": 277.0,
+ "r_x1": 376.0,
+ "r_y1": 324.33,
+ "r_x2": 392.0,
+ "r_y2": 324.33,
+ "r_x3": 392.0,
+ "r_y3": 277.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 8,
@@ -3775,21 +4039,21 @@
"a": 255
},
"rect": {
- "r_x0": 338.59,
- "r_y0": 406.59,
- "r_x1": 352.3,
- "r_y1": 406.59,
- "r_x2": 352.3,
- "r_y2": 373.27,
- "r_x3": 338.59,
- "r_y3": 373.27,
+ "r_x0": 328.0,
+ "r_y0": 247.0,
+ "r_x1": 328.0,
+ "r_y1": 349.67,
+ "r_x2": 344.0,
+ "r_y2": 349.67,
+ "r_x3": 344.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 9,
@@ -3800,21 +4064,21 @@
"a": 255
},
"rect": {
- "r_x0": 338.59,
- "r_y0": 518.61,
- "r_x1": 352.3,
- "r_y1": 518.61,
- "r_x2": 352.3,
- "r_y2": 486.9,
- "r_x3": 338.59,
- "r_y3": 486.9,
+ "r_x0": 296.67,
+ "r_y0": 277.33,
+ "r_x1": 296.67,
+ "r_y1": 324.33,
+ "r_x2": 312.67,
+ "r_y2": 324.33,
+ "r_x3": 312.67,
+ "r_y3": 277.33,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 10,
@@ -3825,21 +4089,21 @@
"a": 255
},
"rect": {
- "r_x0": 265.46,
- "r_y0": 207.76,
- "r_x1": 279.18,
- "r_y1": 207.76,
- "r_x2": 279.18,
- "r_y2": 116.78,
- "r_x3": 265.46,
- "r_y3": 116.78,
+ "r_x0": 490.33,
+ "r_y0": 406.33,
+ "r_x1": 490.33,
+ "r_y1": 518.33,
+ "r_x2": 506.33,
+ "r_y2": 518.33,
+ "r_x3": 506.33,
+ "r_y3": 406.33,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 11,
@@ -3850,21 +4114,21 @@
"a": 255
},
"rect": {
- "r_x0": 265.46,
- "r_y0": 299.73,
- "r_x1": 279.18,
- "r_y1": 299.73,
- "r_x2": 279.18,
- "r_y2": 251.78,
- "r_x3": 265.46,
- "r_y3": 251.78,
+ "r_x0": 459.0,
+ "r_y0": 429.33,
+ "r_x1": 459.0,
+ "r_y1": 499.33,
+ "r_x2": 475.0,
+ "r_y2": 499.33,
+ "r_x3": 475.0,
+ "r_y3": 429.33,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 12,
@@ -3875,35 +4139,110 @@
"a": 255
},
"rect": {
- "r_x0": 265.46,
- "r_y0": 522.85,
- "r_x1": 279.18,
- "r_y1": 522.85,
- "r_x2": 279.18,
- "r_y2": 484.65,
- "r_x3": 265.46,
- "r_y3": 484.65,
+ "r_x0": 408.0,
+ "r_y0": 408.33,
+ "r_x1": 408.0,
+ "r_y1": 514.0,
+ "r_x2": 424.0,
+ "r_y2": 514.0,
+ "r_x3": 424.0,
+ "r_y3": 408.33,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 376.0,
+ "r_y0": 440.67,
+ "r_x1": 376.0,
+ "r_y1": 487.67,
+ "r_x2": 392.0,
+ "r_y2": 487.67,
+ "r_x3": 392.0,
+ "r_y3": 440.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ },
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 328.0,
+ "r_y0": 408.33,
+ "r_x1": 328.0,
+ "r_y1": 514.0,
+ "r_x2": 344.0,
+ "r_y2": 514.0,
+ "r_x3": 344.0,
+ "r_y3": 408.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 296.67,
+ "r_y0": 440.67,
+ "r_x1": 296.67,
+ "r_y1": 487.67,
+ "r_x2": 312.67,
+ "r_y2": 487.67,
+ "r_x3": 312.67,
+ "r_y3": 440.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": [
{
- "id": 4,
+ "id": 1,
"label": "text",
"bbox": {
- "l": 474.71,
- "t": 245.03,
- "r": 488.43,
- "b": 307.59,
+ "l": 485.67,
+ "t": 97.33,
+ "r": 506.33,
+ "b": 190.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 89.0,
"cells": [
{
"index": 0,
@@ -3914,36 +4253,36 @@
"a": 255
},
"rect": {
- "r_x0": 474.71,
- "r_y0": 307.59,
- "r_x1": 488.43,
- "r_y1": 307.59,
- "r_x2": 488.43,
- "r_y2": 245.03,
- "r_x3": 474.71,
- "r_y3": 245.03,
+ "r_x0": 485.67,
+ "r_y0": 97.33,
+ "r_x1": 485.67,
+ "r_y1": 190.0,
+ "r_x2": 506.33,
+ "r_y2": 190.0,
+ "r_x3": 506.33,
+ "r_y3": 97.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 89.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 5,
+ "id": 2,
"label": "text",
"bbox": {
- "l": 474.71,
- "t": 358.65,
- "r": 488.43,
- "b": 421.22,
+ "l": 454.33,
+ "t": 112.0,
+ "r": 475.0,
+ "b": 182.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 92.0,
"cells": [
{
"index": 1,
@@ -3954,36 +4293,36 @@
"a": 255
},
"rect": {
- "r_x0": 474.71,
- "r_y0": 421.22,
- "r_x1": 488.43,
- "r_y1": 421.22,
- "r_x2": 488.43,
- "r_y2": 358.65,
- "r_x3": 474.71,
- "r_y3": 358.65,
+ "r_x0": 454.33,
+ "r_y0": 112.0,
+ "r_x1": 454.33,
+ "r_y1": 182.33,
+ "r_x2": 475.0,
+ "r_y2": 182.33,
+ "r_x3": 475.0,
+ "r_y3": 112.0,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 6,
+ "id": 3,
"label": "text",
"bbox": {
- "l": 474.71,
- "t": 472.27,
- "r": 488.43,
- "b": 534.84,
+ "l": 392.0,
+ "t": 121.67,
+ "r": 408.0,
+ "b": 168.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 2,
@@ -3994,36 +4333,36 @@
"a": 255
},
"rect": {
- "r_x0": 474.71,
- "r_y0": 534.84,
- "r_x1": 488.43,
- "r_y1": 534.84,
- "r_x2": 488.43,
- "r_y2": 472.27,
- "r_x3": 474.71,
- "r_y3": 472.27,
+ "r_x0": 392.0,
+ "r_y0": 121.67,
+ "r_x1": 392.0,
+ "r_y1": 168.67,
+ "r_x2": 408.0,
+ "r_y2": 168.67,
+ "r_x3": 408.0,
+ "r_y3": 121.67,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 7,
+ "id": 4,
"label": "text",
"bbox": {
- "l": 407.21,
- "t": 123.53,
- "r": 420.93,
- "b": 200.67,
+ "l": 312.0,
+ "t": 121.67,
+ "r": 328.0,
+ "b": 168.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 3,
@@ -4034,36 +4373,36 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 200.67,
- "r_x1": 420.93,
- "r_y1": 200.67,
- "r_x2": 420.93,
- "r_y2": 123.53,
- "r_x3": 407.21,
- "r_y3": 123.53,
+ "r_x0": 312.0,
+ "r_y0": 121.67,
+ "r_x1": 312.0,
+ "r_y1": 168.67,
+ "r_x2": 328.0,
+ "r_y2": 168.67,
+ "r_x3": 328.0,
+ "r_y3": 121.67,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 8,
+ "id": 5,
"label": "text",
"bbox": {
- "l": 407.21,
- "t": 241.65,
- "r": 420.93,
- "b": 310.71,
+ "l": 485.67,
+ "t": 232.67,
+ "r": 506.33,
+ "b": 364.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 92.0,
"cells": [
{
"index": 4,
@@ -4074,36 +4413,36 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 310.71,
- "r_x1": 420.93,
- "r_y1": 310.71,
- "r_x2": 420.93,
- "r_y2": 241.65,
- "r_x3": 407.21,
- "r_y3": 241.65,
+ "r_x0": 485.67,
+ "r_y0": 232.67,
+ "r_x1": 485.67,
+ "r_y1": 364.0,
+ "r_x2": 506.33,
+ "r_y2": 364.0,
+ "r_x3": 506.33,
+ "r_y3": 232.67,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 9,
+ "id": 6,
"label": "text",
"bbox": {
- "l": 407.21,
- "t": 347.4,
- "r": 420.93,
- "b": 431.1,
+ "l": 459.0,
+ "t": 265.67,
+ "r": 475.0,
+ "b": 336.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 5,
@@ -4114,36 +4453,36 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 431.1,
- "r_x1": 420.93,
- "r_y1": 431.1,
- "r_x2": 420.93,
- "r_y2": 347.4,
- "r_x3": 407.21,
- "r_y3": 347.4,
+ "r_x0": 459.0,
+ "r_y0": 265.67,
+ "r_x1": 459.0,
+ "r_y1": 336.0,
+ "r_x2": 475.0,
+ "r_y2": 336.0,
+ "r_x3": 475.0,
+ "r_y3": 265.67,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 10,
+ "id": 7,
"label": "text",
"bbox": {
- "l": 407.21,
- "t": 491.4,
- "r": 420.93,
- "b": 515.79,
+ "l": 408.0,
+ "t": 247.0,
+ "r": 424.0,
+ "b": 349.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 89.0,
"cells": [
{
"index": 6,
@@ -4154,36 +4493,36 @@
"a": 255
},
"rect": {
- "r_x0": 407.21,
- "r_y0": 515.79,
- "r_x1": 420.93,
- "r_y1": 515.79,
- "r_x2": 420.93,
- "r_y2": 491.4,
- "r_x3": 407.21,
- "r_y3": 491.4,
+ "r_x0": 408.0,
+ "r_y0": 247.0,
+ "r_x1": 408.0,
+ "r_y1": 349.67,
+ "r_x2": 424.0,
+ "r_y2": 349.67,
+ "r_x3": 424.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 89.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 11,
+ "id": 8,
"label": "text",
"bbox": {
- "l": 338.59,
- "t": 130.28,
- "r": 352.3,
- "b": 194.46,
+ "l": 376.0,
+ "t": 277.0,
+ "r": 392.0,
+ "b": 324.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 7,
@@ -4194,36 +4533,36 @@
"a": 255
},
"rect": {
- "r_x0": 338.59,
- "r_y0": 194.46,
- "r_x1": 352.3,
- "r_y1": 194.46,
- "r_x2": 352.3,
- "r_y2": 130.28,
- "r_x3": 338.59,
- "r_y3": 130.28,
+ "r_x0": 376.0,
+ "r_y0": 277.0,
+ "r_x1": 376.0,
+ "r_y1": 324.33,
+ "r_x2": 392.0,
+ "r_y2": 324.33,
+ "r_x3": 392.0,
+ "r_y3": 277.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 12,
+ "id": 9,
"label": "text",
"bbox": {
- "l": 338.59,
- "t": 373.27,
- "r": 352.3,
- "b": 406.59,
+ "l": 328.0,
+ "t": 247.0,
+ "r": 344.0,
+ "b": 349.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 8,
@@ -4234,36 +4573,36 @@
"a": 255
},
"rect": {
- "r_x0": 338.59,
- "r_y0": 406.59,
- "r_x1": 352.3,
- "r_y1": 406.59,
- "r_x2": 352.3,
- "r_y2": 373.27,
- "r_x3": 338.59,
- "r_y3": 373.27,
+ "r_x0": 328.0,
+ "r_y0": 247.0,
+ "r_x1": 328.0,
+ "r_y1": 349.67,
+ "r_x2": 344.0,
+ "r_y2": 349.67,
+ "r_x3": 344.0,
+ "r_y3": 247.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 13,
+ "id": 10,
"label": "text",
"bbox": {
- "l": 338.59,
- "t": 486.9,
- "r": 352.3,
- "b": 518.61,
+ "l": 296.67,
+ "t": 277.33,
+ "r": 312.67,
+ "b": 324.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 9,
@@ -4274,36 +4613,36 @@
"a": 255
},
"rect": {
- "r_x0": 338.59,
- "r_y0": 518.61,
- "r_x1": 352.3,
- "r_y1": 518.61,
- "r_x2": 352.3,
- "r_y2": 486.9,
- "r_x3": 338.59,
- "r_y3": 486.9,
+ "r_x0": 296.67,
+ "r_y0": 277.33,
+ "r_x1": 296.67,
+ "r_y1": 324.33,
+ "r_x2": 312.67,
+ "r_y2": 324.33,
+ "r_x3": 312.67,
+ "r_y3": 277.33,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 14,
+ "id": 11,
"label": "text",
"bbox": {
- "l": 265.46,
- "t": 116.78,
- "r": 279.18,
- "b": 207.76,
+ "l": 490.33,
+ "t": 406.33,
+ "r": 506.33,
+ "b": 518.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 10,
@@ -4314,36 +4653,36 @@
"a": 255
},
"rect": {
- "r_x0": 265.46,
- "r_y0": 207.76,
- "r_x1": 279.18,
- "r_y1": 207.76,
- "r_x2": 279.18,
- "r_y2": 116.78,
- "r_x3": 265.46,
- "r_y3": 116.78,
+ "r_x0": 490.33,
+ "r_y0": 406.33,
+ "r_x1": 490.33,
+ "r_y1": 518.33,
+ "r_x2": 506.33,
+ "r_y2": 518.33,
+ "r_x3": 506.33,
+ "r_y3": 406.33,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 15,
+ "id": 12,
"label": "text",
"bbox": {
- "l": 265.46,
- "t": 251.78,
- "r": 279.18,
- "b": 299.73,
+ "l": 459.0,
+ "t": 429.33,
+ "r": 475.0,
+ "b": 499.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 11,
@@ -4354,36 +4693,36 @@
"a": 255
},
"rect": {
- "r_x0": 265.46,
- "r_y0": 299.73,
- "r_x1": 279.18,
- "r_y1": 299.73,
- "r_x2": 279.18,
- "r_y2": 251.78,
- "r_x3": 265.46,
- "r_y3": 251.78,
+ "r_x0": 459.0,
+ "r_y0": 429.33,
+ "r_x1": 459.0,
+ "r_y1": 499.33,
+ "r_x2": 475.0,
+ "r_y2": 499.33,
+ "r_x3": 475.0,
+ "r_y3": 429.33,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 16,
+ "id": 13,
"label": "text",
"bbox": {
- "l": 265.46,
- "t": 484.65,
- "r": 279.18,
- "b": 522.85,
+ "l": 408.0,
+ "t": 408.33,
+ "r": 424.0,
+ "b": 514.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 12,
@@ -4394,21 +4733,141 @@
"a": 255
},
"rect": {
- "r_x0": 265.46,
- "r_y0": 522.85,
- "r_x1": 279.18,
- "r_y1": 522.85,
- "r_x2": 279.18,
- "r_y2": 484.65,
- "r_x3": 265.46,
- "r_y3": 484.65,
+ "r_x0": 408.0,
+ "r_y0": 408.33,
+ "r_x1": 408.0,
+ "r_y1": 514.0,
+ "r_x2": 424.0,
+ "r_y2": 514.0,
+ "r_x3": 424.0,
+ "r_y3": 408.33,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 14,
+ "label": "text",
+ "bbox": {
+ "l": 376.0,
+ "t": 440.67,
+ "r": 392.0,
+ "b": 487.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 96.0,
+ "cells": [
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 376.0,
+ "r_y0": 440.67,
+ "r_x1": 376.0,
+ "r_y1": 487.67,
+ "r_x2": 392.0,
+ "r_y2": 487.67,
+ "r_x3": 392.0,
+ "r_y3": 440.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 96.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 15,
+ "label": "text",
+ "bbox": {
+ "l": 328.0,
+ "t": 408.33,
+ "r": 344.0,
+ "b": 514.0,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 328.0,
+ "r_y0": 408.33,
+ "r_x1": 328.0,
+ "r_y1": 514.0,
+ "r_x2": 344.0,
+ "r_y2": 514.0,
+ "r_x3": 344.0,
+ "r_y3": 408.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 16,
+ "label": "text",
+ "bbox": {
+ "l": 296.67,
+ "t": 440.67,
+ "r": 312.67,
+ "b": 487.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 296.67,
+ "r_y0": 440.67,
+ "r_x1": 296.67,
+ "r_y1": 487.67,
+ "r_x2": 312.67,
+ "r_y2": 487.67,
+ "r_x3": 312.67,
+ "r_y3": 440.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
@@ -4417,93 +4876,28 @@
},
"text": null,
"otsl_seq": [
- "fcel",
- "fcel",
- "fcel",
- "ecel",
+ "ched",
+ "ched",
+ "ched",
"nl",
"fcel",
- "ecel",
- "fcel",
- "fcel",
- "nl",
- "ecel",
- "fcel",
"fcel",
"fcel",
"nl",
"fcel",
"fcel",
"fcel",
- "fcel",
"nl"
],
- "num_rows": 4,
- "num_cols": 4,
+ "num_rows": 1,
+ "num_cols": 3,
"table_cells": [
{
"bbox": {
- "l": 474.71,
- "t": 245.03,
- "r": 488.43,
- "b": 307.59,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "Column 0",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 474.71,
- "t": 358.65,
- "r": 488.43,
- "b": 421.22,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "Column 1",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 474.71,
- "t": 472.27,
- "r": 488.43,
- "b": 534.84,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "Column 2",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 407.21,
- "t": 123.53,
- "r": 420.93,
- "b": 200.67,
+ "l": 443.33,
+ "t": 312.0,
+ "r": 490.33,
+ "b": 328.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -4512,74 +4906,17 @@
"end_row_offset_idx": 1,
"start_col_offset_idx": 2,
"end_col_offset_idx": 3,
- "text": "this is row 0",
+ "text": "value",
"column_header": false,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 407.21,
- "t": 241.65,
- "r": 420.93,
- "b": 310.71,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "some cells",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 407.21,
- "t": 347.4,
- "r": 420.93,
- "b": 431.1,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "have content",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 407.21,
- "t": 491.4,
- "r": 420.93,
- "b": 515.79,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "and",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 338.59,
- "t": 130.28,
- "r": 352.3,
- "b": 194.46,
+ "l": 262.33,
+ "t": 296.67,
+ "r": 365.0,
+ "b": 344.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -4588,55 +4925,17 @@
"end_row_offset_idx": 1,
"start_col_offset_idx": 1,
"end_col_offset_idx": 2,
- "text": "and row 1",
+ "text": "Some other value",
"column_header": false,
"row_header": false,
"row_section": false
},
{
"bbox": {
- "l": 338.59,
- "t": 373.27,
- "r": 352.3,
- "b": 406.59,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "other",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 338.59,
- "t": 486.9,
- "r": 352.3,
- "b": 518.61,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "have",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 265.46,
- "t": 116.78,
- "r": 279.18,
- "b": 207.76,
+ "l": 98.0,
+ "t": 296.67,
+ "r": 203.67,
+ "b": 344.0,
"coord_origin": "TOPLEFT"
},
"row_span": 1,
@@ -4645,45 +4944,7 @@
"end_row_offset_idx": 1,
"start_col_offset_idx": 0,
"end_col_offset_idx": 1,
- "text": "and last row 2",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 265.46,
- "t": 251.78,
- "r": 279.18,
- "b": 299.73,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "nothing",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 265.46,
- "t": 484.65,
- "r": 279.18,
- "b": 522.85,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "inside",
+ "text": "Yet another value",
"column_header": false,
"row_header": false,
"row_section": false
diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_90.doctags.txt b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_90.doctags.txt
index b8f362fc..0b13f376 100644
--- a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_90.doctags.txt
+++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_90.doctags.txt
@@ -1,2 +1,2 @@
-Column 2andhaveinsideColumn 1have contentotherColumn 0some cellsnothingthis is row 0and row 1and last row 2
+
\ No newline at end of file
diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_90.json b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_90.json
index 19e3d0e1..dd589a5b 100644
--- a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_90.json
+++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_90.json
@@ -4,7 +4,7 @@
"name": "ocr_test_rotated_90",
"origin": {
"mimetype": "application/pdf",
- "binary_hash": 18214570700708620554,
+ "binary_hash": 6752841177619701916,
"filename": "ocr_test_rotated_90.pdf"
},
"furniture": {
@@ -41,10 +41,10 @@
{
"page_no": 1,
"bbox": {
- "l": 75.13,
- "t": 562.14,
- "r": 361.19,
- "b": 103.0,
+ "l": 87.65,
+ "t": 551.1,
+ "r": 334.58,
+ "b": 69.04,
"coord_origin": "BOTTOMLEFT"
},
"charspan": [
@@ -57,550 +57,10 @@
"references": [],
"footnotes": [],
"data": {
- "table_cells": [
- {
- "bbox": {
- "l": 106.57,
- "t": 534.41,
- "r": 120.29,
- "b": 596.98,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "Column 0",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 106.57,
- "t": 420.78,
- "r": 120.29,
- "b": 483.35,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "Column 1",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 106.57,
- "t": 307.16,
- "r": 120.29,
- "b": 369.73,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "Column 2",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 174.07,
- "t": 641.33,
- "r": 187.79,
- "b": 718.48,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "this is row 0",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 174.07,
- "t": 531.29,
- "r": 187.79,
- "b": 600.35,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "some cells",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 174.07,
- "t": 410.9,
- "r": 187.79,
- "b": 494.6,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "have content",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 174.07,
- "t": 326.21,
- "r": 187.79,
- "b": 350.6,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "and",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 242.7,
- "t": 647.54,
- "r": 256.41,
- "b": 711.73,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "and row 1",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 242.7,
- "t": 435.41,
- "r": 256.41,
- "b": 468.73,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "other",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 242.7,
- "t": 323.39,
- "r": 256.41,
- "b": 355.1,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "have",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 315.82,
- "t": 634.24,
- "r": 329.54,
- "b": 725.23,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "and last row 2",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 315.82,
- "t": 542.27,
- "r": 329.54,
- "b": 590.23,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "nothing",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 315.82,
- "t": 319.15,
- "r": 329.54,
- "b": 357.35,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "inside",
- "column_header": false,
- "row_header": false,
- "row_section": false
- }
- ],
- "num_rows": 4,
- "num_cols": 4,
- "grid": [
- [
- {
- "bbox": {
- "l": 106.57,
- "t": 307.16,
- "r": 120.29,
- "b": 369.73,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "Column 2",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 174.07,
- "t": 326.21,
- "r": 187.79,
- "b": 350.6,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "and",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 242.7,
- "t": 323.39,
- "r": 256.41,
- "b": 355.1,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "have",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 315.82,
- "t": 319.15,
- "r": 329.54,
- "b": 357.35,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "inside",
- "column_header": false,
- "row_header": false,
- "row_section": false
- }
- ],
- [
- {
- "bbox": {
- "l": 106.57,
- "t": 420.78,
- "r": 120.29,
- "b": 483.35,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "Column 1",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 174.07,
- "t": 410.9,
- "r": 187.79,
- "b": 494.6,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "have content",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 242.7,
- "t": 435.41,
- "r": 256.41,
- "b": 468.73,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "other",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "",
- "column_header": false,
- "row_header": false,
- "row_section": false
- }
- ],
- [
- {
- "bbox": {
- "l": 106.57,
- "t": 534.41,
- "r": 120.29,
- "b": 596.98,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "Column 0",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 174.07,
- "t": 531.29,
- "r": 187.79,
- "b": 600.35,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "some cells",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 315.82,
- "t": 542.27,
- "r": 329.54,
- "b": 590.23,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "nothing",
- "column_header": false,
- "row_header": false,
- "row_section": false
- }
- ],
- [
- {
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 174.07,
- "t": 641.33,
- "r": 187.79,
- "b": 718.48,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "this is row 0",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 242.7,
- "t": 647.54,
- "r": 256.41,
- "b": 711.73,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "and row 1",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 315.82,
- "t": 634.24,
- "r": 329.54,
- "b": 725.23,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "and last row 2",
- "column_header": false,
- "row_header": false,
- "row_section": false
- }
- ]
- ]
+ "table_cells": [],
+ "num_rows": 0,
+ "num_cols": 0,
+ "grid": []
},
"annotations": []
}
@@ -610,8 +70,8 @@
"pages": {
"1": {
"size": {
- "width": 595.0,
- "height": 842.0
+ "width": 612.0,
+ "height": 792.0
},
"page_no": 1
}
diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_90.md b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_90.md
index a45b3c36..e69de29b 100644
--- a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_90.md
+++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_90.md
@@ -1,5 +0,0 @@
-| Column 2 | and | have | inside |
-|------------|---------------|-----------|----------------|
-| Column 1 | have content | other | |
-| Column 0 | some cells | | nothing |
-| | this is row 0 | and row 1 | and last row 2 |
\ No newline at end of file
diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_90.pages.json b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_90.pages.json
index cff232ce..186a44d5 100644
--- a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_90.pages.json
+++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_90.pages.json
@@ -2,8 +2,8 @@
{
"page_no": 0,
"size": {
- "width": 595.0,
- "height": 842.0
+ "width": 612.0,
+ "height": 792.0
},
"parsed_page": {
"dimension": {
@@ -11,47 +11,47 @@
"rect": {
"r_x0": 0.0,
"r_y0": 0.0,
- "r_x1": 842.0,
+ "r_x1": 792.0,
"r_y1": 0.0,
- "r_x2": 842.0,
- "r_y2": 595.0,
+ "r_x2": 792.0,
+ "r_y2": 612.0,
"r_x3": 0.0,
- "r_y3": 595.0,
+ "r_y3": 612.0,
"coord_origin": "BOTTOMLEFT"
},
"boundary_type": "crop_box",
"art_bbox": {
"l": 0.0,
- "t": 595.0,
- "r": 842.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
},
"bleed_bbox": {
"l": 0.0,
- "t": 595.0,
- "r": 842.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
},
"crop_bbox": {
"l": 0.0,
- "t": 595.0,
- "r": 842.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
},
"media_bbox": {
"l": 0.0,
- "t": 595.0,
- "r": 842.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
},
"trim_bbox": {
"l": 0.0,
- "t": 595.0,
- "r": 842.0,
+ "t": 612.0,
+ "r": 792.0,
"b": 0.0,
"coord_origin": "BOTTOMLEFT"
}
@@ -69,21 +69,21 @@
"a": 255
},
"rect": {
- "r_x0": 106.57,
- "r_y0": 596.98,
- "r_x1": 120.29,
- "r_y1": 596.98,
- "r_x2": 120.29,
- "r_y2": 534.41,
- "r_x3": 106.57,
- "r_y3": 534.41,
+ "r_x0": 126.33,
+ "r_y0": 694.67,
+ "r_x1": 126.33,
+ "r_y1": 602.0,
+ "r_x2": 105.67,
+ "r_y2": 602.0,
+ "r_x3": 105.67,
+ "r_y3": 694.67,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
},
{
"index": 1,
@@ -94,21 +94,21 @@
"a": 255
},
"rect": {
- "r_x0": 106.57,
- "r_y0": 483.35,
- "r_x1": 120.29,
- "r_y1": 483.35,
- "r_x2": 120.29,
- "r_y2": 420.78,
- "r_x3": 106.57,
- "r_y3": 420.78,
+ "r_x0": 157.67,
+ "r_y0": 680.33,
+ "r_x1": 157.67,
+ "r_y1": 610.0,
+ "r_x2": 137.0,
+ "r_y2": 610.0,
+ "r_x3": 137.0,
+ "r_y3": 680.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 2,
@@ -119,21 +119,21 @@
"a": 255
},
"rect": {
- "r_x0": 106.57,
- "r_y0": 369.73,
- "r_x1": 120.29,
- "r_y1": 369.73,
- "r_x2": 120.29,
- "r_y2": 307.16,
- "r_x3": 106.57,
- "r_y3": 307.16,
+ "r_x0": 220.0,
+ "r_y0": 670.33,
+ "r_x1": 220.0,
+ "r_y1": 623.33,
+ "r_x2": 204.0,
+ "r_y2": 623.33,
+ "r_x3": 204.0,
+ "r_y3": 670.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 3,
@@ -144,21 +144,21 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 718.48,
- "r_x1": 187.79,
- "r_y1": 718.48,
- "r_x2": 187.79,
- "r_y2": 641.33,
- "r_x3": 174.07,
- "r_y3": 641.33,
+ "r_x0": 300.0,
+ "r_y0": 670.33,
+ "r_x1": 300.0,
+ "r_y1": 623.33,
+ "r_x2": 284.0,
+ "r_y2": 623.33,
+ "r_x3": 284.0,
+ "r_y3": 670.33,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 4,
@@ -169,21 +169,21 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 600.35,
- "r_x1": 187.79,
- "r_y1": 600.35,
- "r_x2": 187.79,
- "r_y2": 531.29,
- "r_x3": 174.07,
- "r_y3": 531.29,
+ "r_x0": 126.33,
+ "r_y0": 559.67,
+ "r_x1": 126.33,
+ "r_y1": 428.0,
+ "r_x2": 105.67,
+ "r_y2": 428.0,
+ "r_x3": 105.67,
+ "r_y3": 559.67,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 91.0,
+ "from_ocr": true
},
{
"index": 5,
@@ -194,21 +194,21 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 494.6,
- "r_x1": 187.79,
- "r_y1": 494.6,
- "r_x2": 187.79,
- "r_y2": 410.9,
- "r_x3": 174.07,
- "r_y3": 410.9,
+ "r_x0": 153.0,
+ "r_y0": 526.67,
+ "r_x1": 153.0,
+ "r_y1": 456.0,
+ "r_x2": 137.0,
+ "r_y2": 456.0,
+ "r_x3": 137.0,
+ "r_y3": 526.67,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 6,
@@ -219,21 +219,21 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 350.6,
- "r_x1": 187.79,
- "r_y1": 350.6,
- "r_x2": 187.79,
- "r_y2": 326.21,
- "r_x3": 174.07,
- "r_y3": 326.21,
+ "r_x0": 204.33,
+ "r_y0": 545.0,
+ "r_x1": 204.33,
+ "r_y1": 442.33,
+ "r_x2": 188.33,
+ "r_y2": 442.33,
+ "r_x3": 188.33,
+ "r_y3": 545.0,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 7,
@@ -244,21 +244,21 @@
"a": 255
},
"rect": {
- "r_x0": 242.7,
- "r_y0": 711.73,
- "r_x1": 256.41,
- "r_y1": 711.73,
- "r_x2": 256.41,
- "r_y2": 647.54,
- "r_x3": 242.7,
- "r_y3": 647.54,
+ "r_x0": 236.0,
+ "r_y0": 515.0,
+ "r_x1": 236.0,
+ "r_y1": 468.0,
+ "r_x2": 220.0,
+ "r_y2": 468.0,
+ "r_x3": 220.0,
+ "r_y3": 515.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 8,
@@ -269,21 +269,21 @@
"a": 255
},
"rect": {
- "r_x0": 242.7,
- "r_y0": 468.73,
- "r_x1": 256.41,
- "r_y1": 468.73,
- "r_x2": 256.41,
- "r_y2": 435.41,
- "r_x3": 242.7,
- "r_y3": 435.41,
+ "r_x0": 284.0,
+ "r_y0": 545.0,
+ "r_x1": 284.0,
+ "r_y1": 442.33,
+ "r_x2": 268.0,
+ "r_y2": 442.33,
+ "r_x3": 268.0,
+ "r_y3": 545.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 93.0,
+ "from_ocr": true
},
{
"index": 9,
@@ -294,21 +294,21 @@
"a": 255
},
"rect": {
- "r_x0": 242.7,
- "r_y0": 355.1,
- "r_x1": 256.41,
- "r_y1": 355.1,
- "r_x2": 256.41,
- "r_y2": 323.39,
- "r_x3": 242.7,
- "r_y3": 323.39,
+ "r_x0": 315.33,
+ "r_y0": 515.0,
+ "r_x1": 315.33,
+ "r_y1": 468.0,
+ "r_x2": 299.67,
+ "r_y2": 468.0,
+ "r_x3": 299.67,
+ "r_y3": 515.0,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 10,
@@ -319,21 +319,21 @@
"a": 255
},
"rect": {
- "r_x0": 315.82,
- "r_y0": 725.23,
- "r_x1": 329.54,
- "r_y1": 725.23,
- "r_x2": 329.54,
- "r_y2": 634.24,
- "r_x3": 315.82,
- "r_y3": 634.24,
+ "r_x0": 121.67,
+ "r_y0": 385.67,
+ "r_x1": 121.67,
+ "r_y1": 274.0,
+ "r_x2": 105.67,
+ "r_y2": 274.0,
+ "r_x3": 105.67,
+ "r_y3": 385.67,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 11,
@@ -344,21 +344,21 @@
"a": 255
},
"rect": {
- "r_x0": 315.82,
- "r_y0": 590.23,
- "r_x1": 329.54,
- "r_y1": 590.23,
- "r_x2": 329.54,
- "r_y2": 542.27,
- "r_x3": 315.82,
- "r_y3": 542.27,
+ "r_x0": 153.0,
+ "r_y0": 363.0,
+ "r_x1": 153.0,
+ "r_y1": 292.67,
+ "r_x2": 137.0,
+ "r_y2": 292.67,
+ "r_x3": 137.0,
+ "r_y3": 363.0,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 12,
@@ -369,21 +369,96 @@
"a": 255
},
"rect": {
- "r_x0": 315.82,
- "r_y0": 357.35,
- "r_x1": 329.54,
- "r_y1": 357.35,
- "r_x2": 329.54,
- "r_y2": 319.15,
- "r_x3": 315.82,
- "r_y3": 319.15,
+ "r_x0": 204.33,
+ "r_y0": 384.0,
+ "r_x1": 204.33,
+ "r_y1": 278.0,
+ "r_x2": 188.33,
+ "r_y2": 278.0,
+ "r_x3": 188.33,
+ "r_y3": 384.0,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 236.0,
+ "r_y0": 351.33,
+ "r_x1": 236.0,
+ "r_y1": 304.33,
+ "r_x2": 220.0,
+ "r_y2": 304.33,
+ "r_x3": 220.0,
+ "r_y3": 351.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 284.0,
+ "r_y0": 383.67,
+ "r_x1": 284.0,
+ "r_y1": 278.0,
+ "r_x2": 268.0,
+ "r_y2": 278.0,
+ "r_x3": 268.0,
+ "r_y3": 383.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 315.33,
+ "r_y0": 351.33,
+ "r_x1": 315.33,
+ "r_y1": 304.33,
+ "r_x2": 299.67,
+ "r_y2": 304.33,
+ "r_x3": 299.67,
+ "r_y3": 351.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"has_chars": false,
@@ -399,13 +474,13 @@
"id": 0,
"label": "table",
"bbox": {
- "l": 75.13,
- "t": 279.86,
- "r": 361.19,
- "b": 739.0,
+ "l": 87.65,
+ "t": 240.9,
+ "r": 334.58,
+ "b": 722.96,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.947,
+ "confidence": 0.979,
"cells": [
{
"index": 0,
@@ -416,21 +491,21 @@
"a": 255
},
"rect": {
- "r_x0": 106.57,
- "r_y0": 596.98,
- "r_x1": 120.29,
- "r_y1": 596.98,
- "r_x2": 120.29,
- "r_y2": 534.41,
- "r_x3": 106.57,
- "r_y3": 534.41,
+ "r_x0": 126.33,
+ "r_y0": 694.67,
+ "r_x1": 126.33,
+ "r_y1": 602.0,
+ "r_x2": 105.67,
+ "r_y2": 602.0,
+ "r_x3": 105.67,
+ "r_y3": 694.67,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
},
{
"index": 1,
@@ -441,21 +516,21 @@
"a": 255
},
"rect": {
- "r_x0": 106.57,
- "r_y0": 483.35,
- "r_x1": 120.29,
- "r_y1": 483.35,
- "r_x2": 120.29,
- "r_y2": 420.78,
- "r_x3": 106.57,
- "r_y3": 420.78,
+ "r_x0": 157.67,
+ "r_y0": 680.33,
+ "r_x1": 157.67,
+ "r_y1": 610.0,
+ "r_x2": 137.0,
+ "r_y2": 610.0,
+ "r_x3": 137.0,
+ "r_y3": 680.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 2,
@@ -466,21 +541,21 @@
"a": 255
},
"rect": {
- "r_x0": 106.57,
- "r_y0": 369.73,
- "r_x1": 120.29,
- "r_y1": 369.73,
- "r_x2": 120.29,
- "r_y2": 307.16,
- "r_x3": 106.57,
- "r_y3": 307.16,
+ "r_x0": 220.0,
+ "r_y0": 670.33,
+ "r_x1": 220.0,
+ "r_y1": 623.33,
+ "r_x2": 204.0,
+ "r_y2": 623.33,
+ "r_x3": 204.0,
+ "r_y3": 670.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 3,
@@ -491,21 +566,21 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 718.48,
- "r_x1": 187.79,
- "r_y1": 718.48,
- "r_x2": 187.79,
- "r_y2": 641.33,
- "r_x3": 174.07,
- "r_y3": 641.33,
+ "r_x0": 300.0,
+ "r_y0": 670.33,
+ "r_x1": 300.0,
+ "r_y1": 623.33,
+ "r_x2": 284.0,
+ "r_y2": 623.33,
+ "r_x3": 284.0,
+ "r_y3": 670.33,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 4,
@@ -516,21 +591,21 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 600.35,
- "r_x1": 187.79,
- "r_y1": 600.35,
- "r_x2": 187.79,
- "r_y2": 531.29,
- "r_x3": 174.07,
- "r_y3": 531.29,
+ "r_x0": 126.33,
+ "r_y0": 559.67,
+ "r_x1": 126.33,
+ "r_y1": 428.0,
+ "r_x2": 105.67,
+ "r_y2": 428.0,
+ "r_x3": 105.67,
+ "r_y3": 559.67,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 91.0,
+ "from_ocr": true
},
{
"index": 5,
@@ -541,21 +616,21 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 494.6,
- "r_x1": 187.79,
- "r_y1": 494.6,
- "r_x2": 187.79,
- "r_y2": 410.9,
- "r_x3": 174.07,
- "r_y3": 410.9,
+ "r_x0": 153.0,
+ "r_y0": 526.67,
+ "r_x1": 153.0,
+ "r_y1": 456.0,
+ "r_x2": 137.0,
+ "r_y2": 456.0,
+ "r_x3": 137.0,
+ "r_y3": 526.67,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 6,
@@ -566,21 +641,21 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 350.6,
- "r_x1": 187.79,
- "r_y1": 350.6,
- "r_x2": 187.79,
- "r_y2": 326.21,
- "r_x3": 174.07,
- "r_y3": 326.21,
+ "r_x0": 204.33,
+ "r_y0": 545.0,
+ "r_x1": 204.33,
+ "r_y1": 442.33,
+ "r_x2": 188.33,
+ "r_y2": 442.33,
+ "r_x3": 188.33,
+ "r_y3": 545.0,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 7,
@@ -591,21 +666,21 @@
"a": 255
},
"rect": {
- "r_x0": 242.7,
- "r_y0": 711.73,
- "r_x1": 256.41,
- "r_y1": 711.73,
- "r_x2": 256.41,
- "r_y2": 647.54,
- "r_x3": 242.7,
- "r_y3": 647.54,
+ "r_x0": 236.0,
+ "r_y0": 515.0,
+ "r_x1": 236.0,
+ "r_y1": 468.0,
+ "r_x2": 220.0,
+ "r_y2": 468.0,
+ "r_x3": 220.0,
+ "r_y3": 515.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 8,
@@ -616,21 +691,21 @@
"a": 255
},
"rect": {
- "r_x0": 242.7,
- "r_y0": 468.73,
- "r_x1": 256.41,
- "r_y1": 468.73,
- "r_x2": 256.41,
- "r_y2": 435.41,
- "r_x3": 242.7,
- "r_y3": 435.41,
+ "r_x0": 284.0,
+ "r_y0": 545.0,
+ "r_x1": 284.0,
+ "r_y1": 442.33,
+ "r_x2": 268.0,
+ "r_y2": 442.33,
+ "r_x3": 268.0,
+ "r_y3": 545.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 93.0,
+ "from_ocr": true
},
{
"index": 9,
@@ -641,21 +716,21 @@
"a": 255
},
"rect": {
- "r_x0": 242.7,
- "r_y0": 355.1,
- "r_x1": 256.41,
- "r_y1": 355.1,
- "r_x2": 256.41,
- "r_y2": 323.39,
- "r_x3": 242.7,
- "r_y3": 323.39,
+ "r_x0": 315.33,
+ "r_y0": 515.0,
+ "r_x1": 315.33,
+ "r_y1": 468.0,
+ "r_x2": 299.67,
+ "r_y2": 468.0,
+ "r_x3": 299.67,
+ "r_y3": 515.0,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 10,
@@ -666,21 +741,21 @@
"a": 255
},
"rect": {
- "r_x0": 315.82,
- "r_y0": 725.23,
- "r_x1": 329.54,
- "r_y1": 725.23,
- "r_x2": 329.54,
- "r_y2": 634.24,
- "r_x3": 315.82,
- "r_y3": 634.24,
+ "r_x0": 121.67,
+ "r_y0": 385.67,
+ "r_x1": 121.67,
+ "r_y1": 274.0,
+ "r_x2": 105.67,
+ "r_y2": 274.0,
+ "r_x3": 105.67,
+ "r_y3": 385.67,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 11,
@@ -691,21 +766,21 @@
"a": 255
},
"rect": {
- "r_x0": 315.82,
- "r_y0": 590.23,
- "r_x1": 329.54,
- "r_y1": 590.23,
- "r_x2": 329.54,
- "r_y2": 542.27,
- "r_x3": 315.82,
- "r_y3": 542.27,
+ "r_x0": 153.0,
+ "r_y0": 363.0,
+ "r_x1": 153.0,
+ "r_y1": 292.67,
+ "r_x2": 137.0,
+ "r_y2": 292.67,
+ "r_x3": 137.0,
+ "r_y3": 363.0,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 12,
@@ -716,35 +791,110 @@
"a": 255
},
"rect": {
- "r_x0": 315.82,
- "r_y0": 357.35,
- "r_x1": 329.54,
- "r_y1": 357.35,
- "r_x2": 329.54,
- "r_y2": 319.15,
- "r_x3": 315.82,
- "r_y3": 319.15,
+ "r_x0": 204.33,
+ "r_y0": 384.0,
+ "r_x1": 204.33,
+ "r_y1": 278.0,
+ "r_x2": 188.33,
+ "r_y2": 278.0,
+ "r_x3": 188.33,
+ "r_y3": 384.0,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 236.0,
+ "r_y0": 351.33,
+ "r_x1": 236.0,
+ "r_y1": 304.33,
+ "r_x2": 220.0,
+ "r_y2": 304.33,
+ "r_x3": 220.0,
+ "r_y3": 351.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 284.0,
+ "r_y0": 383.67,
+ "r_x1": 284.0,
+ "r_y1": 278.0,
+ "r_x2": 268.0,
+ "r_y2": 278.0,
+ "r_x3": 268.0,
+ "r_y3": 383.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 315.33,
+ "r_y0": 351.33,
+ "r_x1": 315.33,
+ "r_y1": 304.33,
+ "r_x2": 299.67,
+ "r_y2": 304.33,
+ "r_x3": 299.67,
+ "r_y3": 351.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": [
{
- "id": 11,
+ "id": 1,
"label": "text",
"bbox": {
- "l": 106.57,
- "t": 534.41,
- "r": 120.29,
- "b": 596.98,
+ "l": 105.67,
+ "t": 602.0,
+ "r": 126.33,
+ "b": 694.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 90.0,
"cells": [
{
"index": 0,
@@ -755,36 +905,36 @@
"a": 255
},
"rect": {
- "r_x0": 106.57,
- "r_y0": 596.98,
- "r_x1": 120.29,
- "r_y1": 596.98,
- "r_x2": 120.29,
- "r_y2": 534.41,
- "r_x3": 106.57,
- "r_y3": 534.41,
+ "r_x0": 126.33,
+ "r_y0": 694.67,
+ "r_x1": 126.33,
+ "r_y1": 602.0,
+ "r_x2": 105.67,
+ "r_y2": 602.0,
+ "r_x3": 105.67,
+ "r_y3": 694.67,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 12,
+ "id": 2,
"label": "text",
"bbox": {
- "l": 106.57,
- "t": 420.78,
- "r": 120.29,
- "b": 483.35,
+ "l": 137.0,
+ "t": 610.0,
+ "r": 157.67,
+ "b": 680.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 92.0,
"cells": [
{
"index": 1,
@@ -795,36 +945,36 @@
"a": 255
},
"rect": {
- "r_x0": 106.57,
- "r_y0": 483.35,
- "r_x1": 120.29,
- "r_y1": 483.35,
- "r_x2": 120.29,
- "r_y2": 420.78,
- "r_x3": 106.57,
- "r_y3": 420.78,
+ "r_x0": 157.67,
+ "r_y0": 680.33,
+ "r_x1": 157.67,
+ "r_y1": 610.0,
+ "r_x2": 137.0,
+ "r_y2": 610.0,
+ "r_x3": 137.0,
+ "r_y3": 680.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 13,
+ "id": 3,
"label": "text",
"bbox": {
- "l": 106.57,
- "t": 307.16,
- "r": 120.29,
- "b": 369.73,
+ "l": 204.0,
+ "t": 623.33,
+ "r": 220.0,
+ "b": 670.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 2,
@@ -835,36 +985,36 @@
"a": 255
},
"rect": {
- "r_x0": 106.57,
- "r_y0": 369.73,
- "r_x1": 120.29,
- "r_y1": 369.73,
- "r_x2": 120.29,
- "r_y2": 307.16,
- "r_x3": 106.57,
- "r_y3": 307.16,
+ "r_x0": 220.0,
+ "r_y0": 670.33,
+ "r_x1": 220.0,
+ "r_y1": 623.33,
+ "r_x2": 204.0,
+ "r_y2": 623.33,
+ "r_x3": 204.0,
+ "r_y3": 670.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 14,
+ "id": 4,
"label": "text",
"bbox": {
- "l": 174.07,
- "t": 641.33,
- "r": 187.79,
- "b": 718.48,
+ "l": 284.0,
+ "t": 623.33,
+ "r": 300.0,
+ "b": 670.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 3,
@@ -875,36 +1025,36 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 718.48,
- "r_x1": 187.79,
- "r_y1": 718.48,
- "r_x2": 187.79,
- "r_y2": 641.33,
- "r_x3": 174.07,
- "r_y3": 641.33,
+ "r_x0": 300.0,
+ "r_y0": 670.33,
+ "r_x1": 300.0,
+ "r_y1": 623.33,
+ "r_x2": 284.0,
+ "r_y2": 623.33,
+ "r_x3": 284.0,
+ "r_y3": 670.33,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 15,
+ "id": 5,
"label": "text",
"bbox": {
- "l": 174.07,
- "t": 531.29,
- "r": 187.79,
- "b": 600.35,
+ "l": 105.67,
+ "t": 428.0,
+ "r": 126.33,
+ "b": 559.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 91.0,
"cells": [
{
"index": 4,
@@ -915,36 +1065,36 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 600.35,
- "r_x1": 187.79,
- "r_y1": 600.35,
- "r_x2": 187.79,
- "r_y2": 531.29,
- "r_x3": 174.07,
- "r_y3": 531.29,
+ "r_x0": 126.33,
+ "r_y0": 559.67,
+ "r_x1": 126.33,
+ "r_y1": 428.0,
+ "r_x2": 105.67,
+ "r_y2": 428.0,
+ "r_x3": 105.67,
+ "r_y3": 559.67,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 91.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 16,
+ "id": 6,
"label": "text",
"bbox": {
- "l": 174.07,
- "t": 410.9,
- "r": 187.79,
- "b": 494.6,
+ "l": 137.0,
+ "t": 456.0,
+ "r": 153.0,
+ "b": 526.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 5,
@@ -955,36 +1105,36 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 494.6,
- "r_x1": 187.79,
- "r_y1": 494.6,
- "r_x2": 187.79,
- "r_y2": 410.9,
- "r_x3": 174.07,
- "r_y3": 410.9,
+ "r_x0": 153.0,
+ "r_y0": 526.67,
+ "r_x1": 153.0,
+ "r_y1": 456.0,
+ "r_x2": 137.0,
+ "r_y2": 456.0,
+ "r_x3": 137.0,
+ "r_y3": 526.67,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 17,
+ "id": 7,
"label": "text",
"bbox": {
- "l": 174.07,
- "t": 326.21,
- "r": 187.79,
- "b": 350.6,
+ "l": 188.33,
+ "t": 442.33,
+ "r": 204.33,
+ "b": 545.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 6,
@@ -995,36 +1145,36 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 350.6,
- "r_x1": 187.79,
- "r_y1": 350.6,
- "r_x2": 187.79,
- "r_y2": 326.21,
- "r_x3": 174.07,
- "r_y3": 326.21,
+ "r_x0": 204.33,
+ "r_y0": 545.0,
+ "r_x1": 204.33,
+ "r_y1": 442.33,
+ "r_x2": 188.33,
+ "r_y2": 442.33,
+ "r_x3": 188.33,
+ "r_y3": 545.0,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 18,
+ "id": 8,
"label": "text",
"bbox": {
- "l": 242.7,
- "t": 647.54,
- "r": 256.41,
- "b": 711.73,
+ "l": 220.0,
+ "t": 468.0,
+ "r": 236.0,
+ "b": 515.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 7,
@@ -1035,36 +1185,36 @@
"a": 255
},
"rect": {
- "r_x0": 242.7,
- "r_y0": 711.73,
- "r_x1": 256.41,
- "r_y1": 711.73,
- "r_x2": 256.41,
- "r_y2": 647.54,
- "r_x3": 242.7,
- "r_y3": 647.54,
+ "r_x0": 236.0,
+ "r_y0": 515.0,
+ "r_x1": 236.0,
+ "r_y1": 468.0,
+ "r_x2": 220.0,
+ "r_y2": 468.0,
+ "r_x3": 220.0,
+ "r_y3": 515.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 19,
+ "id": 9,
"label": "text",
"bbox": {
- "l": 242.7,
- "t": 435.41,
- "r": 256.41,
- "b": 468.73,
+ "l": 268.0,
+ "t": 442.33,
+ "r": 284.0,
+ "b": 545.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 93.0,
"cells": [
{
"index": 8,
@@ -1075,36 +1225,36 @@
"a": 255
},
"rect": {
- "r_x0": 242.7,
- "r_y0": 468.73,
- "r_x1": 256.41,
- "r_y1": 468.73,
- "r_x2": 256.41,
- "r_y2": 435.41,
- "r_x3": 242.7,
- "r_y3": 435.41,
+ "r_x0": 284.0,
+ "r_y0": 545.0,
+ "r_x1": 284.0,
+ "r_y1": 442.33,
+ "r_x2": 268.0,
+ "r_y2": 442.33,
+ "r_x3": 268.0,
+ "r_y3": 545.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 93.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 20,
+ "id": 10,
"label": "text",
"bbox": {
- "l": 242.7,
- "t": 323.39,
- "r": 256.41,
- "b": 355.1,
+ "l": 299.67,
+ "t": 468.0,
+ "r": 315.33,
+ "b": 515.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 9,
@@ -1115,36 +1265,36 @@
"a": 255
},
"rect": {
- "r_x0": 242.7,
- "r_y0": 355.1,
- "r_x1": 256.41,
- "r_y1": 355.1,
- "r_x2": 256.41,
- "r_y2": 323.39,
- "r_x3": 242.7,
- "r_y3": 323.39,
+ "r_x0": 315.33,
+ "r_y0": 515.0,
+ "r_x1": 315.33,
+ "r_y1": 468.0,
+ "r_x2": 299.67,
+ "r_y2": 468.0,
+ "r_x3": 299.67,
+ "r_y3": 515.0,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 21,
+ "id": 11,
"label": "text",
"bbox": {
- "l": 315.82,
- "t": 634.24,
- "r": 329.54,
- "b": 725.23,
+ "l": 105.67,
+ "t": 274.0,
+ "r": 121.67,
+ "b": 385.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 10,
@@ -1155,36 +1305,36 @@
"a": 255
},
"rect": {
- "r_x0": 315.82,
- "r_y0": 725.23,
- "r_x1": 329.54,
- "r_y1": 725.23,
- "r_x2": 329.54,
- "r_y2": 634.24,
- "r_x3": 315.82,
- "r_y3": 634.24,
+ "r_x0": 121.67,
+ "r_y0": 385.67,
+ "r_x1": 121.67,
+ "r_y1": 274.0,
+ "r_x2": 105.67,
+ "r_y2": 274.0,
+ "r_x3": 105.67,
+ "r_y3": 385.67,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 22,
+ "id": 12,
"label": "text",
"bbox": {
- "l": 315.82,
- "t": 542.27,
- "r": 329.54,
- "b": 590.23,
+ "l": 137.0,
+ "t": 292.67,
+ "r": 153.0,
+ "b": 363.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 11,
@@ -1195,36 +1345,36 @@
"a": 255
},
"rect": {
- "r_x0": 315.82,
- "r_y0": 590.23,
- "r_x1": 329.54,
- "r_y1": 590.23,
- "r_x2": 329.54,
- "r_y2": 542.27,
- "r_x3": 315.82,
- "r_y3": 542.27,
+ "r_x0": 153.0,
+ "r_y0": 363.0,
+ "r_x1": 153.0,
+ "r_y1": 292.67,
+ "r_x2": 137.0,
+ "r_y2": 292.67,
+ "r_x3": 137.0,
+ "r_y3": 363.0,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 23,
+ "id": 13,
"label": "text",
"bbox": {
- "l": 315.82,
- "t": 319.15,
- "r": 329.54,
- "b": 357.35,
+ "l": 188.33,
+ "t": 278.0,
+ "r": 204.33,
+ "b": 384.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 12,
@@ -1235,21 +1385,141 @@
"a": 255
},
"rect": {
- "r_x0": 315.82,
- "r_y0": 357.35,
- "r_x1": 329.54,
- "r_y1": 357.35,
- "r_x2": 329.54,
- "r_y2": 319.15,
- "r_x3": 315.82,
- "r_y3": 319.15,
+ "r_x0": 204.33,
+ "r_y0": 384.0,
+ "r_x1": 204.33,
+ "r_y1": 278.0,
+ "r_x2": 188.33,
+ "r_y2": 278.0,
+ "r_x3": 188.33,
+ "r_y3": 384.0,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 14,
+ "label": "text",
+ "bbox": {
+ "l": 220.0,
+ "t": 304.33,
+ "r": 236.0,
+ "b": 351.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 236.0,
+ "r_y0": 351.33,
+ "r_x1": 236.0,
+ "r_y1": 304.33,
+ "r_x2": 220.0,
+ "r_y2": 304.33,
+ "r_x3": 220.0,
+ "r_y3": 351.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 15,
+ "label": "text",
+ "bbox": {
+ "l": 268.0,
+ "t": 278.0,
+ "r": 284.0,
+ "b": 383.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 284.0,
+ "r_y0": 383.67,
+ "r_x1": 284.0,
+ "r_y1": 278.0,
+ "r_x2": 268.0,
+ "r_y2": 278.0,
+ "r_x3": 268.0,
+ "r_y3": 383.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 16,
+ "label": "text",
+ "bbox": {
+ "l": 299.67,
+ "t": 304.33,
+ "r": 315.33,
+ "b": 351.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 315.33,
+ "r_y0": 351.33,
+ "r_x1": 315.33,
+ "r_y1": 304.33,
+ "r_x2": 299.67,
+ "r_y2": 304.33,
+ "r_x3": 299.67,
+ "r_y3": 351.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
@@ -1268,13 +1538,13 @@
"id": 0,
"label": "table",
"bbox": {
- "l": 75.13,
- "t": 279.86,
- "r": 361.19,
- "b": 739.0,
+ "l": 87.65,
+ "t": 240.9,
+ "r": 334.58,
+ "b": 722.96,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.947,
+ "confidence": 0.979,
"cells": [
{
"index": 0,
@@ -1285,21 +1555,21 @@
"a": 255
},
"rect": {
- "r_x0": 106.57,
- "r_y0": 596.98,
- "r_x1": 120.29,
- "r_y1": 596.98,
- "r_x2": 120.29,
- "r_y2": 534.41,
- "r_x3": 106.57,
- "r_y3": 534.41,
+ "r_x0": 126.33,
+ "r_y0": 694.67,
+ "r_x1": 126.33,
+ "r_y1": 602.0,
+ "r_x2": 105.67,
+ "r_y2": 602.0,
+ "r_x3": 105.67,
+ "r_y3": 694.67,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
},
{
"index": 1,
@@ -1310,21 +1580,21 @@
"a": 255
},
"rect": {
- "r_x0": 106.57,
- "r_y0": 483.35,
- "r_x1": 120.29,
- "r_y1": 483.35,
- "r_x2": 120.29,
- "r_y2": 420.78,
- "r_x3": 106.57,
- "r_y3": 420.78,
+ "r_x0": 157.67,
+ "r_y0": 680.33,
+ "r_x1": 157.67,
+ "r_y1": 610.0,
+ "r_x2": 137.0,
+ "r_y2": 610.0,
+ "r_x3": 137.0,
+ "r_y3": 680.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 2,
@@ -1335,21 +1605,21 @@
"a": 255
},
"rect": {
- "r_x0": 106.57,
- "r_y0": 369.73,
- "r_x1": 120.29,
- "r_y1": 369.73,
- "r_x2": 120.29,
- "r_y2": 307.16,
- "r_x3": 106.57,
- "r_y3": 307.16,
+ "r_x0": 220.0,
+ "r_y0": 670.33,
+ "r_x1": 220.0,
+ "r_y1": 623.33,
+ "r_x2": 204.0,
+ "r_y2": 623.33,
+ "r_x3": 204.0,
+ "r_y3": 670.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 3,
@@ -1360,21 +1630,21 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 718.48,
- "r_x1": 187.79,
- "r_y1": 718.48,
- "r_x2": 187.79,
- "r_y2": 641.33,
- "r_x3": 174.07,
- "r_y3": 641.33,
+ "r_x0": 300.0,
+ "r_y0": 670.33,
+ "r_x1": 300.0,
+ "r_y1": 623.33,
+ "r_x2": 284.0,
+ "r_y2": 623.33,
+ "r_x3": 284.0,
+ "r_y3": 670.33,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 4,
@@ -1385,21 +1655,21 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 600.35,
- "r_x1": 187.79,
- "r_y1": 600.35,
- "r_x2": 187.79,
- "r_y2": 531.29,
- "r_x3": 174.07,
- "r_y3": 531.29,
+ "r_x0": 126.33,
+ "r_y0": 559.67,
+ "r_x1": 126.33,
+ "r_y1": 428.0,
+ "r_x2": 105.67,
+ "r_y2": 428.0,
+ "r_x3": 105.67,
+ "r_y3": 559.67,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 91.0,
+ "from_ocr": true
},
{
"index": 5,
@@ -1410,21 +1680,21 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 494.6,
- "r_x1": 187.79,
- "r_y1": 494.6,
- "r_x2": 187.79,
- "r_y2": 410.9,
- "r_x3": 174.07,
- "r_y3": 410.9,
+ "r_x0": 153.0,
+ "r_y0": 526.67,
+ "r_x1": 153.0,
+ "r_y1": 456.0,
+ "r_x2": 137.0,
+ "r_y2": 456.0,
+ "r_x3": 137.0,
+ "r_y3": 526.67,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 6,
@@ -1435,21 +1705,21 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 350.6,
- "r_x1": 187.79,
- "r_y1": 350.6,
- "r_x2": 187.79,
- "r_y2": 326.21,
- "r_x3": 174.07,
- "r_y3": 326.21,
+ "r_x0": 204.33,
+ "r_y0": 545.0,
+ "r_x1": 204.33,
+ "r_y1": 442.33,
+ "r_x2": 188.33,
+ "r_y2": 442.33,
+ "r_x3": 188.33,
+ "r_y3": 545.0,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 7,
@@ -1460,21 +1730,21 @@
"a": 255
},
"rect": {
- "r_x0": 242.7,
- "r_y0": 711.73,
- "r_x1": 256.41,
- "r_y1": 711.73,
- "r_x2": 256.41,
- "r_y2": 647.54,
- "r_x3": 242.7,
- "r_y3": 647.54,
+ "r_x0": 236.0,
+ "r_y0": 515.0,
+ "r_x1": 236.0,
+ "r_y1": 468.0,
+ "r_x2": 220.0,
+ "r_y2": 468.0,
+ "r_x3": 220.0,
+ "r_y3": 515.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 8,
@@ -1485,21 +1755,21 @@
"a": 255
},
"rect": {
- "r_x0": 242.7,
- "r_y0": 468.73,
- "r_x1": 256.41,
- "r_y1": 468.73,
- "r_x2": 256.41,
- "r_y2": 435.41,
- "r_x3": 242.7,
- "r_y3": 435.41,
+ "r_x0": 284.0,
+ "r_y0": 545.0,
+ "r_x1": 284.0,
+ "r_y1": 442.33,
+ "r_x2": 268.0,
+ "r_y2": 442.33,
+ "r_x3": 268.0,
+ "r_y3": 545.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 93.0,
+ "from_ocr": true
},
{
"index": 9,
@@ -1510,21 +1780,21 @@
"a": 255
},
"rect": {
- "r_x0": 242.7,
- "r_y0": 355.1,
- "r_x1": 256.41,
- "r_y1": 355.1,
- "r_x2": 256.41,
- "r_y2": 323.39,
- "r_x3": 242.7,
- "r_y3": 323.39,
+ "r_x0": 315.33,
+ "r_y0": 515.0,
+ "r_x1": 315.33,
+ "r_y1": 468.0,
+ "r_x2": 299.67,
+ "r_y2": 468.0,
+ "r_x3": 299.67,
+ "r_y3": 515.0,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 10,
@@ -1535,21 +1805,21 @@
"a": 255
},
"rect": {
- "r_x0": 315.82,
- "r_y0": 725.23,
- "r_x1": 329.54,
- "r_y1": 725.23,
- "r_x2": 329.54,
- "r_y2": 634.24,
- "r_x3": 315.82,
- "r_y3": 634.24,
+ "r_x0": 121.67,
+ "r_y0": 385.67,
+ "r_x1": 121.67,
+ "r_y1": 274.0,
+ "r_x2": 105.67,
+ "r_y2": 274.0,
+ "r_x3": 105.67,
+ "r_y3": 385.67,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 11,
@@ -1560,21 +1830,21 @@
"a": 255
},
"rect": {
- "r_x0": 315.82,
- "r_y0": 590.23,
- "r_x1": 329.54,
- "r_y1": 590.23,
- "r_x2": 329.54,
- "r_y2": 542.27,
- "r_x3": 315.82,
- "r_y3": 542.27,
+ "r_x0": 153.0,
+ "r_y0": 363.0,
+ "r_x1": 153.0,
+ "r_y1": 292.67,
+ "r_x2": 137.0,
+ "r_y2": 292.67,
+ "r_x3": 137.0,
+ "r_y3": 363.0,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 12,
@@ -1585,35 +1855,110 @@
"a": 255
},
"rect": {
- "r_x0": 315.82,
- "r_y0": 357.35,
- "r_x1": 329.54,
- "r_y1": 357.35,
- "r_x2": 329.54,
- "r_y2": 319.15,
- "r_x3": 315.82,
- "r_y3": 319.15,
+ "r_x0": 204.33,
+ "r_y0": 384.0,
+ "r_x1": 204.33,
+ "r_y1": 278.0,
+ "r_x2": 188.33,
+ "r_y2": 278.0,
+ "r_x3": 188.33,
+ "r_y3": 384.0,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 236.0,
+ "r_y0": 351.33,
+ "r_x1": 236.0,
+ "r_y1": 304.33,
+ "r_x2": 220.0,
+ "r_y2": 304.33,
+ "r_x3": 220.0,
+ "r_y3": 351.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 284.0,
+ "r_y0": 383.67,
+ "r_x1": 284.0,
+ "r_y1": 278.0,
+ "r_x2": 268.0,
+ "r_y2": 278.0,
+ "r_x3": 268.0,
+ "r_y3": 383.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 315.33,
+ "r_y0": 351.33,
+ "r_x1": 315.33,
+ "r_y1": 304.33,
+ "r_x2": 299.67,
+ "r_y2": 304.33,
+ "r_x3": 299.67,
+ "r_y3": 351.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": [
{
- "id": 11,
+ "id": 1,
"label": "text",
"bbox": {
- "l": 106.57,
- "t": 534.41,
- "r": 120.29,
- "b": 596.98,
+ "l": 105.67,
+ "t": 602.0,
+ "r": 126.33,
+ "b": 694.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 90.0,
"cells": [
{
"index": 0,
@@ -1624,36 +1969,36 @@
"a": 255
},
"rect": {
- "r_x0": 106.57,
- "r_y0": 596.98,
- "r_x1": 120.29,
- "r_y1": 596.98,
- "r_x2": 120.29,
- "r_y2": 534.41,
- "r_x3": 106.57,
- "r_y3": 534.41,
+ "r_x0": 126.33,
+ "r_y0": 694.67,
+ "r_x1": 126.33,
+ "r_y1": 602.0,
+ "r_x2": 105.67,
+ "r_y2": 602.0,
+ "r_x3": 105.67,
+ "r_y3": 694.67,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 12,
+ "id": 2,
"label": "text",
"bbox": {
- "l": 106.57,
- "t": 420.78,
- "r": 120.29,
- "b": 483.35,
+ "l": 137.0,
+ "t": 610.0,
+ "r": 157.67,
+ "b": 680.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 92.0,
"cells": [
{
"index": 1,
@@ -1664,36 +2009,36 @@
"a": 255
},
"rect": {
- "r_x0": 106.57,
- "r_y0": 483.35,
- "r_x1": 120.29,
- "r_y1": 483.35,
- "r_x2": 120.29,
- "r_y2": 420.78,
- "r_x3": 106.57,
- "r_y3": 420.78,
+ "r_x0": 157.67,
+ "r_y0": 680.33,
+ "r_x1": 157.67,
+ "r_y1": 610.0,
+ "r_x2": 137.0,
+ "r_y2": 610.0,
+ "r_x3": 137.0,
+ "r_y3": 680.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 13,
+ "id": 3,
"label": "text",
"bbox": {
- "l": 106.57,
- "t": 307.16,
- "r": 120.29,
- "b": 369.73,
+ "l": 204.0,
+ "t": 623.33,
+ "r": 220.0,
+ "b": 670.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 2,
@@ -1704,36 +2049,36 @@
"a": 255
},
"rect": {
- "r_x0": 106.57,
- "r_y0": 369.73,
- "r_x1": 120.29,
- "r_y1": 369.73,
- "r_x2": 120.29,
- "r_y2": 307.16,
- "r_x3": 106.57,
- "r_y3": 307.16,
+ "r_x0": 220.0,
+ "r_y0": 670.33,
+ "r_x1": 220.0,
+ "r_y1": 623.33,
+ "r_x2": 204.0,
+ "r_y2": 623.33,
+ "r_x3": 204.0,
+ "r_y3": 670.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 14,
+ "id": 4,
"label": "text",
"bbox": {
- "l": 174.07,
- "t": 641.33,
- "r": 187.79,
- "b": 718.48,
+ "l": 284.0,
+ "t": 623.33,
+ "r": 300.0,
+ "b": 670.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 3,
@@ -1744,36 +2089,36 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 718.48,
- "r_x1": 187.79,
- "r_y1": 718.48,
- "r_x2": 187.79,
- "r_y2": 641.33,
- "r_x3": 174.07,
- "r_y3": 641.33,
+ "r_x0": 300.0,
+ "r_y0": 670.33,
+ "r_x1": 300.0,
+ "r_y1": 623.33,
+ "r_x2": 284.0,
+ "r_y2": 623.33,
+ "r_x3": 284.0,
+ "r_y3": 670.33,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 15,
+ "id": 5,
"label": "text",
"bbox": {
- "l": 174.07,
- "t": 531.29,
- "r": 187.79,
- "b": 600.35,
+ "l": 105.67,
+ "t": 428.0,
+ "r": 126.33,
+ "b": 559.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 91.0,
"cells": [
{
"index": 4,
@@ -1784,36 +2129,36 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 600.35,
- "r_x1": 187.79,
- "r_y1": 600.35,
- "r_x2": 187.79,
- "r_y2": 531.29,
- "r_x3": 174.07,
- "r_y3": 531.29,
+ "r_x0": 126.33,
+ "r_y0": 559.67,
+ "r_x1": 126.33,
+ "r_y1": 428.0,
+ "r_x2": 105.67,
+ "r_y2": 428.0,
+ "r_x3": 105.67,
+ "r_y3": 559.67,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 91.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 16,
+ "id": 6,
"label": "text",
"bbox": {
- "l": 174.07,
- "t": 410.9,
- "r": 187.79,
- "b": 494.6,
+ "l": 137.0,
+ "t": 456.0,
+ "r": 153.0,
+ "b": 526.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 5,
@@ -1824,36 +2169,36 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 494.6,
- "r_x1": 187.79,
- "r_y1": 494.6,
- "r_x2": 187.79,
- "r_y2": 410.9,
- "r_x3": 174.07,
- "r_y3": 410.9,
+ "r_x0": 153.0,
+ "r_y0": 526.67,
+ "r_x1": 153.0,
+ "r_y1": 456.0,
+ "r_x2": 137.0,
+ "r_y2": 456.0,
+ "r_x3": 137.0,
+ "r_y3": 526.67,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 17,
+ "id": 7,
"label": "text",
"bbox": {
- "l": 174.07,
- "t": 326.21,
- "r": 187.79,
- "b": 350.6,
+ "l": 188.33,
+ "t": 442.33,
+ "r": 204.33,
+ "b": 545.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 6,
@@ -1864,36 +2209,36 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 350.6,
- "r_x1": 187.79,
- "r_y1": 350.6,
- "r_x2": 187.79,
- "r_y2": 326.21,
- "r_x3": 174.07,
- "r_y3": 326.21,
+ "r_x0": 204.33,
+ "r_y0": 545.0,
+ "r_x1": 204.33,
+ "r_y1": 442.33,
+ "r_x2": 188.33,
+ "r_y2": 442.33,
+ "r_x3": 188.33,
+ "r_y3": 545.0,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 18,
+ "id": 8,
"label": "text",
"bbox": {
- "l": 242.7,
- "t": 647.54,
- "r": 256.41,
- "b": 711.73,
+ "l": 220.0,
+ "t": 468.0,
+ "r": 236.0,
+ "b": 515.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 7,
@@ -1904,36 +2249,36 @@
"a": 255
},
"rect": {
- "r_x0": 242.7,
- "r_y0": 711.73,
- "r_x1": 256.41,
- "r_y1": 711.73,
- "r_x2": 256.41,
- "r_y2": 647.54,
- "r_x3": 242.7,
- "r_y3": 647.54,
+ "r_x0": 236.0,
+ "r_y0": 515.0,
+ "r_x1": 236.0,
+ "r_y1": 468.0,
+ "r_x2": 220.0,
+ "r_y2": 468.0,
+ "r_x3": 220.0,
+ "r_y3": 515.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 19,
+ "id": 9,
"label": "text",
"bbox": {
- "l": 242.7,
- "t": 435.41,
- "r": 256.41,
- "b": 468.73,
+ "l": 268.0,
+ "t": 442.33,
+ "r": 284.0,
+ "b": 545.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 93.0,
"cells": [
{
"index": 8,
@@ -1944,36 +2289,36 @@
"a": 255
},
"rect": {
- "r_x0": 242.7,
- "r_y0": 468.73,
- "r_x1": 256.41,
- "r_y1": 468.73,
- "r_x2": 256.41,
- "r_y2": 435.41,
- "r_x3": 242.7,
- "r_y3": 435.41,
+ "r_x0": 284.0,
+ "r_y0": 545.0,
+ "r_x1": 284.0,
+ "r_y1": 442.33,
+ "r_x2": 268.0,
+ "r_y2": 442.33,
+ "r_x3": 268.0,
+ "r_y3": 545.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 93.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 20,
+ "id": 10,
"label": "text",
"bbox": {
- "l": 242.7,
- "t": 323.39,
- "r": 256.41,
- "b": 355.1,
+ "l": 299.67,
+ "t": 468.0,
+ "r": 315.33,
+ "b": 515.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 9,
@@ -1984,36 +2329,36 @@
"a": 255
},
"rect": {
- "r_x0": 242.7,
- "r_y0": 355.1,
- "r_x1": 256.41,
- "r_y1": 355.1,
- "r_x2": 256.41,
- "r_y2": 323.39,
- "r_x3": 242.7,
- "r_y3": 323.39,
+ "r_x0": 315.33,
+ "r_y0": 515.0,
+ "r_x1": 315.33,
+ "r_y1": 468.0,
+ "r_x2": 299.67,
+ "r_y2": 468.0,
+ "r_x3": 299.67,
+ "r_y3": 515.0,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 21,
+ "id": 11,
"label": "text",
"bbox": {
- "l": 315.82,
- "t": 634.24,
- "r": 329.54,
- "b": 725.23,
+ "l": 105.67,
+ "t": 274.0,
+ "r": 121.67,
+ "b": 385.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 10,
@@ -2024,36 +2369,36 @@
"a": 255
},
"rect": {
- "r_x0": 315.82,
- "r_y0": 725.23,
- "r_x1": 329.54,
- "r_y1": 725.23,
- "r_x2": 329.54,
- "r_y2": 634.24,
- "r_x3": 315.82,
- "r_y3": 634.24,
+ "r_x0": 121.67,
+ "r_y0": 385.67,
+ "r_x1": 121.67,
+ "r_y1": 274.0,
+ "r_x2": 105.67,
+ "r_y2": 274.0,
+ "r_x3": 105.67,
+ "r_y3": 385.67,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 22,
+ "id": 12,
"label": "text",
"bbox": {
- "l": 315.82,
- "t": 542.27,
- "r": 329.54,
- "b": 590.23,
+ "l": 137.0,
+ "t": 292.67,
+ "r": 153.0,
+ "b": 363.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 11,
@@ -2064,36 +2409,36 @@
"a": 255
},
"rect": {
- "r_x0": 315.82,
- "r_y0": 590.23,
- "r_x1": 329.54,
- "r_y1": 590.23,
- "r_x2": 329.54,
- "r_y2": 542.27,
- "r_x3": 315.82,
- "r_y3": 542.27,
+ "r_x0": 153.0,
+ "r_y0": 363.0,
+ "r_x1": 153.0,
+ "r_y1": 292.67,
+ "r_x2": 137.0,
+ "r_y2": 292.67,
+ "r_x3": 137.0,
+ "r_y3": 363.0,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 23,
+ "id": 13,
"label": "text",
"bbox": {
- "l": 315.82,
- "t": 319.15,
- "r": 329.54,
- "b": 357.35,
+ "l": 188.33,
+ "t": 278.0,
+ "r": 204.33,
+ "b": 384.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 12,
@@ -2104,21 +2449,141 @@
"a": 255
},
"rect": {
- "r_x0": 315.82,
- "r_y0": 357.35,
- "r_x1": 329.54,
- "r_y1": 357.35,
- "r_x2": 329.54,
- "r_y2": 319.15,
- "r_x3": 315.82,
- "r_y3": 319.15,
+ "r_x0": 204.33,
+ "r_y0": 384.0,
+ "r_x1": 204.33,
+ "r_y1": 278.0,
+ "r_x2": 188.33,
+ "r_y2": 278.0,
+ "r_x3": 188.33,
+ "r_y3": 384.0,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 14,
+ "label": "text",
+ "bbox": {
+ "l": 220.0,
+ "t": 304.33,
+ "r": 236.0,
+ "b": 351.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 236.0,
+ "r_y0": 351.33,
+ "r_x1": 236.0,
+ "r_y1": 304.33,
+ "r_x2": 220.0,
+ "r_y2": 304.33,
+ "r_x3": 220.0,
+ "r_y3": 351.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 15,
+ "label": "text",
+ "bbox": {
+ "l": 268.0,
+ "t": 278.0,
+ "r": 284.0,
+ "b": 383.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 284.0,
+ "r_y0": 383.67,
+ "r_x1": 284.0,
+ "r_y1": 278.0,
+ "r_x2": 268.0,
+ "r_y2": 278.0,
+ "r_x3": 268.0,
+ "r_y3": 383.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 16,
+ "label": "text",
+ "bbox": {
+ "l": 299.67,
+ "t": 304.33,
+ "r": 315.33,
+ "b": 351.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 315.33,
+ "r_y0": 351.33,
+ "r_x1": 315.33,
+ "r_y1": 304.33,
+ "r_x2": 299.67,
+ "r_y2": 304.33,
+ "r_x3": 299.67,
+ "r_y3": 351.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
@@ -2127,278 +2592,22 @@
},
"text": null,
"otsl_seq": [
- "fcel",
- "fcel",
- "fcel",
- "fcel",
+ "ched",
+ "ched",
+ "ched",
"nl",
"fcel",
"fcel",
"fcel",
- "ecel",
"nl",
"fcel",
"fcel",
- "ecel",
- "fcel",
- "nl",
- "ecel",
- "fcel",
- "fcel",
"fcel",
"nl"
],
- "num_rows": 4,
- "num_cols": 4,
- "table_cells": [
- {
- "bbox": {
- "l": 106.57,
- "t": 534.41,
- "r": 120.29,
- "b": 596.98,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "Column 0",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 106.57,
- "t": 420.78,
- "r": 120.29,
- "b": 483.35,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "Column 1",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 106.57,
- "t": 307.16,
- "r": 120.29,
- "b": 369.73,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "Column 2",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 174.07,
- "t": 641.33,
- "r": 187.79,
- "b": 718.48,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "this is row 0",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 174.07,
- "t": 531.29,
- "r": 187.79,
- "b": 600.35,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "some cells",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 174.07,
- "t": 410.9,
- "r": 187.79,
- "b": 494.6,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "have content",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 174.07,
- "t": 326.21,
- "r": 187.79,
- "b": 350.6,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "and",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 242.7,
- "t": 647.54,
- "r": 256.41,
- "b": 711.73,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "and row 1",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 242.7,
- "t": 435.41,
- "r": 256.41,
- "b": 468.73,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "other",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 242.7,
- "t": 323.39,
- "r": 256.41,
- "b": 355.1,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "have",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 315.82,
- "t": 634.24,
- "r": 329.54,
- "b": 725.23,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "and last row 2",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 315.82,
- "t": 542.27,
- "r": 329.54,
- "b": 590.23,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "nothing",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 315.82,
- "t": 319.15,
- "r": 329.54,
- "b": 357.35,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "inside",
- "column_header": false,
- "row_header": false,
- "row_section": false
- }
- ]
+ "num_rows": 0,
+ "num_cols": 0,
+ "table_cells": []
}
}
},
@@ -2416,13 +2625,13 @@
"id": 0,
"label": "table",
"bbox": {
- "l": 75.13,
- "t": 279.86,
- "r": 361.19,
- "b": 739.0,
+ "l": 87.65,
+ "t": 240.9,
+ "r": 334.58,
+ "b": 722.96,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.947,
+ "confidence": 0.979,
"cells": [
{
"index": 0,
@@ -2433,21 +2642,21 @@
"a": 255
},
"rect": {
- "r_x0": 106.57,
- "r_y0": 596.98,
- "r_x1": 120.29,
- "r_y1": 596.98,
- "r_x2": 120.29,
- "r_y2": 534.41,
- "r_x3": 106.57,
- "r_y3": 534.41,
+ "r_x0": 126.33,
+ "r_y0": 694.67,
+ "r_x1": 126.33,
+ "r_y1": 602.0,
+ "r_x2": 105.67,
+ "r_y2": 602.0,
+ "r_x3": 105.67,
+ "r_y3": 694.67,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
},
{
"index": 1,
@@ -2458,21 +2667,21 @@
"a": 255
},
"rect": {
- "r_x0": 106.57,
- "r_y0": 483.35,
- "r_x1": 120.29,
- "r_y1": 483.35,
- "r_x2": 120.29,
- "r_y2": 420.78,
- "r_x3": 106.57,
- "r_y3": 420.78,
+ "r_x0": 157.67,
+ "r_y0": 680.33,
+ "r_x1": 157.67,
+ "r_y1": 610.0,
+ "r_x2": 137.0,
+ "r_y2": 610.0,
+ "r_x3": 137.0,
+ "r_y3": 680.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 2,
@@ -2483,21 +2692,21 @@
"a": 255
},
"rect": {
- "r_x0": 106.57,
- "r_y0": 369.73,
- "r_x1": 120.29,
- "r_y1": 369.73,
- "r_x2": 120.29,
- "r_y2": 307.16,
- "r_x3": 106.57,
- "r_y3": 307.16,
+ "r_x0": 220.0,
+ "r_y0": 670.33,
+ "r_x1": 220.0,
+ "r_y1": 623.33,
+ "r_x2": 204.0,
+ "r_y2": 623.33,
+ "r_x3": 204.0,
+ "r_y3": 670.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 3,
@@ -2508,21 +2717,21 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 718.48,
- "r_x1": 187.79,
- "r_y1": 718.48,
- "r_x2": 187.79,
- "r_y2": 641.33,
- "r_x3": 174.07,
- "r_y3": 641.33,
+ "r_x0": 300.0,
+ "r_y0": 670.33,
+ "r_x1": 300.0,
+ "r_y1": 623.33,
+ "r_x2": 284.0,
+ "r_y2": 623.33,
+ "r_x3": 284.0,
+ "r_y3": 670.33,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 4,
@@ -2533,21 +2742,21 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 600.35,
- "r_x1": 187.79,
- "r_y1": 600.35,
- "r_x2": 187.79,
- "r_y2": 531.29,
- "r_x3": 174.07,
- "r_y3": 531.29,
+ "r_x0": 126.33,
+ "r_y0": 559.67,
+ "r_x1": 126.33,
+ "r_y1": 428.0,
+ "r_x2": 105.67,
+ "r_y2": 428.0,
+ "r_x3": 105.67,
+ "r_y3": 559.67,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 91.0,
+ "from_ocr": true
},
{
"index": 5,
@@ -2558,21 +2767,21 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 494.6,
- "r_x1": 187.79,
- "r_y1": 494.6,
- "r_x2": 187.79,
- "r_y2": 410.9,
- "r_x3": 174.07,
- "r_y3": 410.9,
+ "r_x0": 153.0,
+ "r_y0": 526.67,
+ "r_x1": 153.0,
+ "r_y1": 456.0,
+ "r_x2": 137.0,
+ "r_y2": 456.0,
+ "r_x3": 137.0,
+ "r_y3": 526.67,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 6,
@@ -2583,21 +2792,21 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 350.6,
- "r_x1": 187.79,
- "r_y1": 350.6,
- "r_x2": 187.79,
- "r_y2": 326.21,
- "r_x3": 174.07,
- "r_y3": 326.21,
+ "r_x0": 204.33,
+ "r_y0": 545.0,
+ "r_x1": 204.33,
+ "r_y1": 442.33,
+ "r_x2": 188.33,
+ "r_y2": 442.33,
+ "r_x3": 188.33,
+ "r_y3": 545.0,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 7,
@@ -2608,21 +2817,21 @@
"a": 255
},
"rect": {
- "r_x0": 242.7,
- "r_y0": 711.73,
- "r_x1": 256.41,
- "r_y1": 711.73,
- "r_x2": 256.41,
- "r_y2": 647.54,
- "r_x3": 242.7,
- "r_y3": 647.54,
+ "r_x0": 236.0,
+ "r_y0": 515.0,
+ "r_x1": 236.0,
+ "r_y1": 468.0,
+ "r_x2": 220.0,
+ "r_y2": 468.0,
+ "r_x3": 220.0,
+ "r_y3": 515.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 8,
@@ -2633,21 +2842,21 @@
"a": 255
},
"rect": {
- "r_x0": 242.7,
- "r_y0": 468.73,
- "r_x1": 256.41,
- "r_y1": 468.73,
- "r_x2": 256.41,
- "r_y2": 435.41,
- "r_x3": 242.7,
- "r_y3": 435.41,
+ "r_x0": 284.0,
+ "r_y0": 545.0,
+ "r_x1": 284.0,
+ "r_y1": 442.33,
+ "r_x2": 268.0,
+ "r_y2": 442.33,
+ "r_x3": 268.0,
+ "r_y3": 545.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 93.0,
+ "from_ocr": true
},
{
"index": 9,
@@ -2658,21 +2867,21 @@
"a": 255
},
"rect": {
- "r_x0": 242.7,
- "r_y0": 355.1,
- "r_x1": 256.41,
- "r_y1": 355.1,
- "r_x2": 256.41,
- "r_y2": 323.39,
- "r_x3": 242.7,
- "r_y3": 323.39,
+ "r_x0": 315.33,
+ "r_y0": 515.0,
+ "r_x1": 315.33,
+ "r_y1": 468.0,
+ "r_x2": 299.67,
+ "r_y2": 468.0,
+ "r_x3": 299.67,
+ "r_y3": 515.0,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 10,
@@ -2683,21 +2892,21 @@
"a": 255
},
"rect": {
- "r_x0": 315.82,
- "r_y0": 725.23,
- "r_x1": 329.54,
- "r_y1": 725.23,
- "r_x2": 329.54,
- "r_y2": 634.24,
- "r_x3": 315.82,
- "r_y3": 634.24,
+ "r_x0": 121.67,
+ "r_y0": 385.67,
+ "r_x1": 121.67,
+ "r_y1": 274.0,
+ "r_x2": 105.67,
+ "r_y2": 274.0,
+ "r_x3": 105.67,
+ "r_y3": 385.67,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 11,
@@ -2708,21 +2917,21 @@
"a": 255
},
"rect": {
- "r_x0": 315.82,
- "r_y0": 590.23,
- "r_x1": 329.54,
- "r_y1": 590.23,
- "r_x2": 329.54,
- "r_y2": 542.27,
- "r_x3": 315.82,
- "r_y3": 542.27,
+ "r_x0": 153.0,
+ "r_y0": 363.0,
+ "r_x1": 153.0,
+ "r_y1": 292.67,
+ "r_x2": 137.0,
+ "r_y2": 292.67,
+ "r_x3": 137.0,
+ "r_y3": 363.0,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 12,
@@ -2733,35 +2942,110 @@
"a": 255
},
"rect": {
- "r_x0": 315.82,
- "r_y0": 357.35,
- "r_x1": 329.54,
- "r_y1": 357.35,
- "r_x2": 329.54,
- "r_y2": 319.15,
- "r_x3": 315.82,
- "r_y3": 319.15,
+ "r_x0": 204.33,
+ "r_y0": 384.0,
+ "r_x1": 204.33,
+ "r_y1": 278.0,
+ "r_x2": 188.33,
+ "r_y2": 278.0,
+ "r_x3": 188.33,
+ "r_y3": 384.0,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 236.0,
+ "r_y0": 351.33,
+ "r_x1": 236.0,
+ "r_y1": 304.33,
+ "r_x2": 220.0,
+ "r_y2": 304.33,
+ "r_x3": 220.0,
+ "r_y3": 351.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 284.0,
+ "r_y0": 383.67,
+ "r_x1": 284.0,
+ "r_y1": 278.0,
+ "r_x2": 268.0,
+ "r_y2": 278.0,
+ "r_x3": 268.0,
+ "r_y3": 383.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 315.33,
+ "r_y0": 351.33,
+ "r_x1": 315.33,
+ "r_y1": 304.33,
+ "r_x2": 299.67,
+ "r_y2": 304.33,
+ "r_x3": 299.67,
+ "r_y3": 351.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": [
{
- "id": 11,
+ "id": 1,
"label": "text",
"bbox": {
- "l": 106.57,
- "t": 534.41,
- "r": 120.29,
- "b": 596.98,
+ "l": 105.67,
+ "t": 602.0,
+ "r": 126.33,
+ "b": 694.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 90.0,
"cells": [
{
"index": 0,
@@ -2772,36 +3056,36 @@
"a": 255
},
"rect": {
- "r_x0": 106.57,
- "r_y0": 596.98,
- "r_x1": 120.29,
- "r_y1": 596.98,
- "r_x2": 120.29,
- "r_y2": 534.41,
- "r_x3": 106.57,
- "r_y3": 534.41,
+ "r_x0": 126.33,
+ "r_y0": 694.67,
+ "r_x1": 126.33,
+ "r_y1": 602.0,
+ "r_x2": 105.67,
+ "r_y2": 602.0,
+ "r_x3": 105.67,
+ "r_y3": 694.67,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 12,
+ "id": 2,
"label": "text",
"bbox": {
- "l": 106.57,
- "t": 420.78,
- "r": 120.29,
- "b": 483.35,
+ "l": 137.0,
+ "t": 610.0,
+ "r": 157.67,
+ "b": 680.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 92.0,
"cells": [
{
"index": 1,
@@ -2812,36 +3096,36 @@
"a": 255
},
"rect": {
- "r_x0": 106.57,
- "r_y0": 483.35,
- "r_x1": 120.29,
- "r_y1": 483.35,
- "r_x2": 120.29,
- "r_y2": 420.78,
- "r_x3": 106.57,
- "r_y3": 420.78,
+ "r_x0": 157.67,
+ "r_y0": 680.33,
+ "r_x1": 157.67,
+ "r_y1": 610.0,
+ "r_x2": 137.0,
+ "r_y2": 610.0,
+ "r_x3": 137.0,
+ "r_y3": 680.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 13,
+ "id": 3,
"label": "text",
"bbox": {
- "l": 106.57,
- "t": 307.16,
- "r": 120.29,
- "b": 369.73,
+ "l": 204.0,
+ "t": 623.33,
+ "r": 220.0,
+ "b": 670.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 2,
@@ -2852,36 +3136,36 @@
"a": 255
},
"rect": {
- "r_x0": 106.57,
- "r_y0": 369.73,
- "r_x1": 120.29,
- "r_y1": 369.73,
- "r_x2": 120.29,
- "r_y2": 307.16,
- "r_x3": 106.57,
- "r_y3": 307.16,
+ "r_x0": 220.0,
+ "r_y0": 670.33,
+ "r_x1": 220.0,
+ "r_y1": 623.33,
+ "r_x2": 204.0,
+ "r_y2": 623.33,
+ "r_x3": 204.0,
+ "r_y3": 670.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 14,
+ "id": 4,
"label": "text",
"bbox": {
- "l": 174.07,
- "t": 641.33,
- "r": 187.79,
- "b": 718.48,
+ "l": 284.0,
+ "t": 623.33,
+ "r": 300.0,
+ "b": 670.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 3,
@@ -2892,36 +3176,36 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 718.48,
- "r_x1": 187.79,
- "r_y1": 718.48,
- "r_x2": 187.79,
- "r_y2": 641.33,
- "r_x3": 174.07,
- "r_y3": 641.33,
+ "r_x0": 300.0,
+ "r_y0": 670.33,
+ "r_x1": 300.0,
+ "r_y1": 623.33,
+ "r_x2": 284.0,
+ "r_y2": 623.33,
+ "r_x3": 284.0,
+ "r_y3": 670.33,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 15,
+ "id": 5,
"label": "text",
"bbox": {
- "l": 174.07,
- "t": 531.29,
- "r": 187.79,
- "b": 600.35,
+ "l": 105.67,
+ "t": 428.0,
+ "r": 126.33,
+ "b": 559.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 91.0,
"cells": [
{
"index": 4,
@@ -2932,36 +3216,36 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 600.35,
- "r_x1": 187.79,
- "r_y1": 600.35,
- "r_x2": 187.79,
- "r_y2": 531.29,
- "r_x3": 174.07,
- "r_y3": 531.29,
+ "r_x0": 126.33,
+ "r_y0": 559.67,
+ "r_x1": 126.33,
+ "r_y1": 428.0,
+ "r_x2": 105.67,
+ "r_y2": 428.0,
+ "r_x3": 105.67,
+ "r_y3": 559.67,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 91.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 16,
+ "id": 6,
"label": "text",
"bbox": {
- "l": 174.07,
- "t": 410.9,
- "r": 187.79,
- "b": 494.6,
+ "l": 137.0,
+ "t": 456.0,
+ "r": 153.0,
+ "b": 526.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 5,
@@ -2972,36 +3256,36 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 494.6,
- "r_x1": 187.79,
- "r_y1": 494.6,
- "r_x2": 187.79,
- "r_y2": 410.9,
- "r_x3": 174.07,
- "r_y3": 410.9,
+ "r_x0": 153.0,
+ "r_y0": 526.67,
+ "r_x1": 153.0,
+ "r_y1": 456.0,
+ "r_x2": 137.0,
+ "r_y2": 456.0,
+ "r_x3": 137.0,
+ "r_y3": 526.67,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 17,
+ "id": 7,
"label": "text",
"bbox": {
- "l": 174.07,
- "t": 326.21,
- "r": 187.79,
- "b": 350.6,
+ "l": 188.33,
+ "t": 442.33,
+ "r": 204.33,
+ "b": 545.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 6,
@@ -3012,36 +3296,36 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 350.6,
- "r_x1": 187.79,
- "r_y1": 350.6,
- "r_x2": 187.79,
- "r_y2": 326.21,
- "r_x3": 174.07,
- "r_y3": 326.21,
+ "r_x0": 204.33,
+ "r_y0": 545.0,
+ "r_x1": 204.33,
+ "r_y1": 442.33,
+ "r_x2": 188.33,
+ "r_y2": 442.33,
+ "r_x3": 188.33,
+ "r_y3": 545.0,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 18,
+ "id": 8,
"label": "text",
"bbox": {
- "l": 242.7,
- "t": 647.54,
- "r": 256.41,
- "b": 711.73,
+ "l": 220.0,
+ "t": 468.0,
+ "r": 236.0,
+ "b": 515.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 7,
@@ -3052,36 +3336,36 @@
"a": 255
},
"rect": {
- "r_x0": 242.7,
- "r_y0": 711.73,
- "r_x1": 256.41,
- "r_y1": 711.73,
- "r_x2": 256.41,
- "r_y2": 647.54,
- "r_x3": 242.7,
- "r_y3": 647.54,
+ "r_x0": 236.0,
+ "r_y0": 515.0,
+ "r_x1": 236.0,
+ "r_y1": 468.0,
+ "r_x2": 220.0,
+ "r_y2": 468.0,
+ "r_x3": 220.0,
+ "r_y3": 515.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 19,
+ "id": 9,
"label": "text",
"bbox": {
- "l": 242.7,
- "t": 435.41,
- "r": 256.41,
- "b": 468.73,
+ "l": 268.0,
+ "t": 442.33,
+ "r": 284.0,
+ "b": 545.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 93.0,
"cells": [
{
"index": 8,
@@ -3092,36 +3376,36 @@
"a": 255
},
"rect": {
- "r_x0": 242.7,
- "r_y0": 468.73,
- "r_x1": 256.41,
- "r_y1": 468.73,
- "r_x2": 256.41,
- "r_y2": 435.41,
- "r_x3": 242.7,
- "r_y3": 435.41,
+ "r_x0": 284.0,
+ "r_y0": 545.0,
+ "r_x1": 284.0,
+ "r_y1": 442.33,
+ "r_x2": 268.0,
+ "r_y2": 442.33,
+ "r_x3": 268.0,
+ "r_y3": 545.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 93.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 20,
+ "id": 10,
"label": "text",
"bbox": {
- "l": 242.7,
- "t": 323.39,
- "r": 256.41,
- "b": 355.1,
+ "l": 299.67,
+ "t": 468.0,
+ "r": 315.33,
+ "b": 515.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 9,
@@ -3132,36 +3416,36 @@
"a": 255
},
"rect": {
- "r_x0": 242.7,
- "r_y0": 355.1,
- "r_x1": 256.41,
- "r_y1": 355.1,
- "r_x2": 256.41,
- "r_y2": 323.39,
- "r_x3": 242.7,
- "r_y3": 323.39,
+ "r_x0": 315.33,
+ "r_y0": 515.0,
+ "r_x1": 315.33,
+ "r_y1": 468.0,
+ "r_x2": 299.67,
+ "r_y2": 468.0,
+ "r_x3": 299.67,
+ "r_y3": 515.0,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 21,
+ "id": 11,
"label": "text",
"bbox": {
- "l": 315.82,
- "t": 634.24,
- "r": 329.54,
- "b": 725.23,
+ "l": 105.67,
+ "t": 274.0,
+ "r": 121.67,
+ "b": 385.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 10,
@@ -3172,36 +3456,36 @@
"a": 255
},
"rect": {
- "r_x0": 315.82,
- "r_y0": 725.23,
- "r_x1": 329.54,
- "r_y1": 725.23,
- "r_x2": 329.54,
- "r_y2": 634.24,
- "r_x3": 315.82,
- "r_y3": 634.24,
+ "r_x0": 121.67,
+ "r_y0": 385.67,
+ "r_x1": 121.67,
+ "r_y1": 274.0,
+ "r_x2": 105.67,
+ "r_y2": 274.0,
+ "r_x3": 105.67,
+ "r_y3": 385.67,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 22,
+ "id": 12,
"label": "text",
"bbox": {
- "l": 315.82,
- "t": 542.27,
- "r": 329.54,
- "b": 590.23,
+ "l": 137.0,
+ "t": 292.67,
+ "r": 153.0,
+ "b": 363.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 11,
@@ -3212,36 +3496,36 @@
"a": 255
},
"rect": {
- "r_x0": 315.82,
- "r_y0": 590.23,
- "r_x1": 329.54,
- "r_y1": 590.23,
- "r_x2": 329.54,
- "r_y2": 542.27,
- "r_x3": 315.82,
- "r_y3": 542.27,
+ "r_x0": 153.0,
+ "r_y0": 363.0,
+ "r_x1": 153.0,
+ "r_y1": 292.67,
+ "r_x2": 137.0,
+ "r_y2": 292.67,
+ "r_x3": 137.0,
+ "r_y3": 363.0,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 23,
+ "id": 13,
"label": "text",
"bbox": {
- "l": 315.82,
- "t": 319.15,
- "r": 329.54,
- "b": 357.35,
+ "l": 188.33,
+ "t": 278.0,
+ "r": 204.33,
+ "b": 384.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 12,
@@ -3252,21 +3536,141 @@
"a": 255
},
"rect": {
- "r_x0": 315.82,
- "r_y0": 357.35,
- "r_x1": 329.54,
- "r_y1": 357.35,
- "r_x2": 329.54,
- "r_y2": 319.15,
- "r_x3": 315.82,
- "r_y3": 319.15,
+ "r_x0": 204.33,
+ "r_y0": 384.0,
+ "r_x1": 204.33,
+ "r_y1": 278.0,
+ "r_x2": 188.33,
+ "r_y2": 278.0,
+ "r_x3": 188.33,
+ "r_y3": 384.0,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 14,
+ "label": "text",
+ "bbox": {
+ "l": 220.0,
+ "t": 304.33,
+ "r": 236.0,
+ "b": 351.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 236.0,
+ "r_y0": 351.33,
+ "r_x1": 236.0,
+ "r_y1": 304.33,
+ "r_x2": 220.0,
+ "r_y2": 304.33,
+ "r_x3": 220.0,
+ "r_y3": 351.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 15,
+ "label": "text",
+ "bbox": {
+ "l": 268.0,
+ "t": 278.0,
+ "r": 284.0,
+ "b": 383.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 284.0,
+ "r_y0": 383.67,
+ "r_x1": 284.0,
+ "r_y1": 278.0,
+ "r_x2": 268.0,
+ "r_y2": 278.0,
+ "r_x3": 268.0,
+ "r_y3": 383.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 16,
+ "label": "text",
+ "bbox": {
+ "l": 299.67,
+ "t": 304.33,
+ "r": 315.33,
+ "b": 351.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 315.33,
+ "r_y0": 351.33,
+ "r_x1": 315.33,
+ "r_y1": 304.33,
+ "r_x2": 299.67,
+ "r_y2": 304.33,
+ "r_x3": 299.67,
+ "r_y3": 351.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
@@ -3275,278 +3679,22 @@
},
"text": null,
"otsl_seq": [
- "fcel",
- "fcel",
- "fcel",
- "fcel",
+ "ched",
+ "ched",
+ "ched",
"nl",
"fcel",
"fcel",
"fcel",
- "ecel",
"nl",
"fcel",
"fcel",
- "ecel",
- "fcel",
- "nl",
- "ecel",
- "fcel",
- "fcel",
"fcel",
"nl"
],
- "num_rows": 4,
- "num_cols": 4,
- "table_cells": [
- {
- "bbox": {
- "l": 106.57,
- "t": 534.41,
- "r": 120.29,
- "b": 596.98,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "Column 0",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 106.57,
- "t": 420.78,
- "r": 120.29,
- "b": 483.35,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "Column 1",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 106.57,
- "t": 307.16,
- "r": 120.29,
- "b": 369.73,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "Column 2",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 174.07,
- "t": 641.33,
- "r": 187.79,
- "b": 718.48,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "this is row 0",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 174.07,
- "t": 531.29,
- "r": 187.79,
- "b": 600.35,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "some cells",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 174.07,
- "t": 410.9,
- "r": 187.79,
- "b": 494.6,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "have content",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 174.07,
- "t": 326.21,
- "r": 187.79,
- "b": 350.6,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "and",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 242.7,
- "t": 647.54,
- "r": 256.41,
- "b": 711.73,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "and row 1",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 242.7,
- "t": 435.41,
- "r": 256.41,
- "b": 468.73,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "other",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 242.7,
- "t": 323.39,
- "r": 256.41,
- "b": 355.1,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "have",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 315.82,
- "t": 634.24,
- "r": 329.54,
- "b": 725.23,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "and last row 2",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 315.82,
- "t": 542.27,
- "r": 329.54,
- "b": 590.23,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "nothing",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 315.82,
- "t": 319.15,
- "r": 329.54,
- "b": 357.35,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "inside",
- "column_header": false,
- "row_header": false,
- "row_section": false
- }
- ]
+ "num_rows": 0,
+ "num_cols": 0,
+ "table_cells": []
}
],
"body": [
@@ -3558,13 +3706,13 @@
"id": 0,
"label": "table",
"bbox": {
- "l": 75.13,
- "t": 279.86,
- "r": 361.19,
- "b": 739.0,
+ "l": 87.65,
+ "t": 240.9,
+ "r": 334.58,
+ "b": 722.96,
"coord_origin": "TOPLEFT"
},
- "confidence": 0.947,
+ "confidence": 0.979,
"cells": [
{
"index": 0,
@@ -3575,21 +3723,21 @@
"a": 255
},
"rect": {
- "r_x0": 106.57,
- "r_y0": 596.98,
- "r_x1": 120.29,
- "r_y1": 596.98,
- "r_x2": 120.29,
- "r_y2": 534.41,
- "r_x3": 106.57,
- "r_y3": 534.41,
+ "r_x0": 126.33,
+ "r_y0": 694.67,
+ "r_x1": 126.33,
+ "r_y1": 602.0,
+ "r_x2": 105.67,
+ "r_y2": 602.0,
+ "r_x3": 105.67,
+ "r_y3": 694.67,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
},
{
"index": 1,
@@ -3600,21 +3748,21 @@
"a": 255
},
"rect": {
- "r_x0": 106.57,
- "r_y0": 483.35,
- "r_x1": 120.29,
- "r_y1": 483.35,
- "r_x2": 120.29,
- "r_y2": 420.78,
- "r_x3": 106.57,
- "r_y3": 420.78,
+ "r_x0": 157.67,
+ "r_y0": 680.33,
+ "r_x1": 157.67,
+ "r_y1": 610.0,
+ "r_x2": 137.0,
+ "r_y2": 610.0,
+ "r_x3": 137.0,
+ "r_y3": 680.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
},
{
"index": 2,
@@ -3625,21 +3773,21 @@
"a": 255
},
"rect": {
- "r_x0": 106.57,
- "r_y0": 369.73,
- "r_x1": 120.29,
- "r_y1": 369.73,
- "r_x2": 120.29,
- "r_y2": 307.16,
- "r_x3": 106.57,
- "r_y3": 307.16,
+ "r_x0": 220.0,
+ "r_y0": 670.33,
+ "r_x1": 220.0,
+ "r_y1": 623.33,
+ "r_x2": 204.0,
+ "r_y2": 623.33,
+ "r_x3": 204.0,
+ "r_y3": 670.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 3,
@@ -3650,21 +3798,21 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 718.48,
- "r_x1": 187.79,
- "r_y1": 718.48,
- "r_x2": 187.79,
- "r_y2": 641.33,
- "r_x3": 174.07,
- "r_y3": 641.33,
+ "r_x0": 300.0,
+ "r_y0": 670.33,
+ "r_x1": 300.0,
+ "r_y1": 623.33,
+ "r_x2": 284.0,
+ "r_y2": 623.33,
+ "r_x3": 284.0,
+ "r_y3": 670.33,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 4,
@@ -3675,21 +3823,21 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 600.35,
- "r_x1": 187.79,
- "r_y1": 600.35,
- "r_x2": 187.79,
- "r_y2": 531.29,
- "r_x3": 174.07,
- "r_y3": 531.29,
+ "r_x0": 126.33,
+ "r_y0": 559.67,
+ "r_x1": 126.33,
+ "r_y1": 428.0,
+ "r_x2": 105.67,
+ "r_y2": 428.0,
+ "r_x3": 105.67,
+ "r_y3": 559.67,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 91.0,
+ "from_ocr": true
},
{
"index": 5,
@@ -3700,21 +3848,21 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 494.6,
- "r_x1": 187.79,
- "r_y1": 494.6,
- "r_x2": 187.79,
- "r_y2": 410.9,
- "r_x3": 174.07,
- "r_y3": 410.9,
+ "r_x0": 153.0,
+ "r_y0": 526.67,
+ "r_x1": 153.0,
+ "r_y1": 456.0,
+ "r_x2": 137.0,
+ "r_y2": 456.0,
+ "r_x3": 137.0,
+ "r_y3": 526.67,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 6,
@@ -3725,21 +3873,21 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 350.6,
- "r_x1": 187.79,
- "r_y1": 350.6,
- "r_x2": 187.79,
- "r_y2": 326.21,
- "r_x3": 174.07,
- "r_y3": 326.21,
+ "r_x0": 204.33,
+ "r_y0": 545.0,
+ "r_x1": 204.33,
+ "r_y1": 442.33,
+ "r_x2": 188.33,
+ "r_y2": 442.33,
+ "r_x3": 188.33,
+ "r_y3": 545.0,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 7,
@@ -3750,21 +3898,21 @@
"a": 255
},
"rect": {
- "r_x0": 242.7,
- "r_y0": 711.73,
- "r_x1": 256.41,
- "r_y1": 711.73,
- "r_x2": 256.41,
- "r_y2": 647.54,
- "r_x3": 242.7,
- "r_y3": 647.54,
+ "r_x0": 236.0,
+ "r_y0": 515.0,
+ "r_x1": 236.0,
+ "r_y1": 468.0,
+ "r_x2": 220.0,
+ "r_y2": 468.0,
+ "r_x3": 220.0,
+ "r_y3": 515.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 8,
@@ -3775,21 +3923,21 @@
"a": 255
},
"rect": {
- "r_x0": 242.7,
- "r_y0": 468.73,
- "r_x1": 256.41,
- "r_y1": 468.73,
- "r_x2": 256.41,
- "r_y2": 435.41,
- "r_x3": 242.7,
- "r_y3": 435.41,
+ "r_x0": 284.0,
+ "r_y0": 545.0,
+ "r_x1": 284.0,
+ "r_y1": 442.33,
+ "r_x2": 268.0,
+ "r_y2": 442.33,
+ "r_x3": 268.0,
+ "r_y3": 545.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 93.0,
+ "from_ocr": true
},
{
"index": 9,
@@ -3800,21 +3948,21 @@
"a": 255
},
"rect": {
- "r_x0": 242.7,
- "r_y0": 355.1,
- "r_x1": 256.41,
- "r_y1": 355.1,
- "r_x2": 256.41,
- "r_y2": 323.39,
- "r_x3": 242.7,
- "r_y3": 323.39,
+ "r_x0": 315.33,
+ "r_y0": 515.0,
+ "r_x1": 315.33,
+ "r_y1": 468.0,
+ "r_x2": 299.67,
+ "r_y2": 468.0,
+ "r_x3": 299.67,
+ "r_y3": 515.0,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
},
{
"index": 10,
@@ -3825,21 +3973,21 @@
"a": 255
},
"rect": {
- "r_x0": 315.82,
- "r_y0": 725.23,
- "r_x1": 329.54,
- "r_y1": 725.23,
- "r_x2": 329.54,
- "r_y2": 634.24,
- "r_x3": 315.82,
- "r_y3": 634.24,
+ "r_x0": 121.67,
+ "r_y0": 385.67,
+ "r_x1": 121.67,
+ "r_y1": 274.0,
+ "r_x2": 105.67,
+ "r_y2": 274.0,
+ "r_x3": 105.67,
+ "r_y3": 385.67,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
},
{
"index": 11,
@@ -3850,21 +3998,21 @@
"a": 255
},
"rect": {
- "r_x0": 315.82,
- "r_y0": 590.23,
- "r_x1": 329.54,
- "r_y1": 590.23,
- "r_x2": 329.54,
- "r_y2": 542.27,
- "r_x3": 315.82,
- "r_y3": 542.27,
+ "r_x0": 153.0,
+ "r_y0": 363.0,
+ "r_x1": 153.0,
+ "r_y1": 292.67,
+ "r_x2": 137.0,
+ "r_y2": 292.67,
+ "r_x3": 137.0,
+ "r_y3": 363.0,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
},
{
"index": 12,
@@ -3875,35 +4023,110 @@
"a": 255
},
"rect": {
- "r_x0": 315.82,
- "r_y0": 357.35,
- "r_x1": 329.54,
- "r_y1": 357.35,
- "r_x2": 329.54,
- "r_y2": 319.15,
- "r_x3": 315.82,
- "r_y3": 319.15,
+ "r_x0": 204.33,
+ "r_y0": 384.0,
+ "r_x1": 204.33,
+ "r_y1": 278.0,
+ "r_x2": 188.33,
+ "r_y2": 278.0,
+ "r_x3": 188.33,
+ "r_y3": 384.0,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 236.0,
+ "r_y0": 351.33,
+ "r_x1": 236.0,
+ "r_y1": 304.33,
+ "r_x2": 220.0,
+ "r_y2": 304.33,
+ "r_x3": 220.0,
+ "r_y3": 351.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 284.0,
+ "r_y0": 383.67,
+ "r_x1": 284.0,
+ "r_y1": 278.0,
+ "r_x2": 268.0,
+ "r_y2": 278.0,
+ "r_x3": 268.0,
+ "r_y3": 383.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ },
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 315.33,
+ "r_y0": 351.33,
+ "r_x1": 315.33,
+ "r_y1": 304.33,
+ "r_x2": 299.67,
+ "r_y2": 304.33,
+ "r_x3": 299.67,
+ "r_y3": 351.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": [
{
- "id": 11,
+ "id": 1,
"label": "text",
"bbox": {
- "l": 106.57,
- "t": 534.41,
- "r": 120.29,
- "b": 596.98,
+ "l": 105.67,
+ "t": 602.0,
+ "r": 126.33,
+ "b": 694.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 90.0,
"cells": [
{
"index": 0,
@@ -3914,36 +4137,36 @@
"a": 255
},
"rect": {
- "r_x0": 106.57,
- "r_y0": 596.98,
- "r_x1": 120.29,
- "r_y1": 596.98,
- "r_x2": 120.29,
- "r_y2": 534.41,
- "r_x3": 106.57,
- "r_y3": 534.41,
+ "r_x0": 126.33,
+ "r_y0": 694.67,
+ "r_x1": 126.33,
+ "r_y1": 602.0,
+ "r_x2": 105.67,
+ "r_y2": 602.0,
+ "r_x3": 105.67,
+ "r_y3": 694.67,
"coord_origin": "TOPLEFT"
},
- "text": "Column 0",
- "orig": "Column 0",
+ "text": "Vertically",
+ "orig": "Vertically",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 90.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 12,
+ "id": 2,
"label": "text",
"bbox": {
- "l": 106.57,
- "t": 420.78,
- "r": 120.29,
- "b": 483.35,
+ "l": 137.0,
+ "t": 610.0,
+ "r": 157.67,
+ "b": 680.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 92.0,
"cells": [
{
"index": 1,
@@ -3954,36 +4177,36 @@
"a": 255
},
"rect": {
- "r_x0": 106.57,
- "r_y0": 483.35,
- "r_x1": 120.29,
- "r_y1": 483.35,
- "r_x2": 120.29,
- "r_y2": 420.78,
- "r_x3": 106.57,
- "r_y3": 420.78,
+ "r_x0": 157.67,
+ "r_y0": 680.33,
+ "r_x1": 157.67,
+ "r_y1": 610.0,
+ "r_x2": 137.0,
+ "r_y2": 610.0,
+ "r_x3": 137.0,
+ "r_y3": 680.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 1",
- "orig": "Column 1",
+ "text": "merged",
+ "orig": "merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 92.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 13,
+ "id": 3,
"label": "text",
"bbox": {
- "l": 106.57,
- "t": 307.16,
- "r": 120.29,
- "b": 369.73,
+ "l": 204.0,
+ "t": 623.33,
+ "r": 220.0,
+ "b": 670.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 2,
@@ -3994,36 +4217,36 @@
"a": 255
},
"rect": {
- "r_x0": 106.57,
- "r_y0": 369.73,
- "r_x1": 120.29,
- "r_y1": 369.73,
- "r_x2": 120.29,
- "r_y2": 307.16,
- "r_x3": 106.57,
- "r_y3": 307.16,
+ "r_x0": 220.0,
+ "r_y0": 670.33,
+ "r_x1": 220.0,
+ "r_y1": 623.33,
+ "r_x2": 204.0,
+ "r_y2": 623.33,
+ "r_x3": 204.0,
+ "r_y3": 670.33,
"coord_origin": "TOPLEFT"
},
- "text": "Column 2",
- "orig": "Column 2",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 14,
+ "id": 4,
"label": "text",
"bbox": {
- "l": 174.07,
- "t": 641.33,
- "r": 187.79,
- "b": 718.48,
+ "l": 284.0,
+ "t": 623.33,
+ "r": 300.0,
+ "b": 670.33,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 3,
@@ -4034,36 +4257,36 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 718.48,
- "r_x1": 187.79,
- "r_y1": 718.48,
- "r_x2": 187.79,
- "r_y2": 641.33,
- "r_x3": 174.07,
- "r_y3": 641.33,
+ "r_x0": 300.0,
+ "r_y0": 670.33,
+ "r_x1": 300.0,
+ "r_y1": 623.33,
+ "r_x2": 284.0,
+ "r_y2": 623.33,
+ "r_x3": 284.0,
+ "r_y3": 670.33,
"coord_origin": "TOPLEFT"
},
- "text": "this is row 0",
- "orig": "this is row 0",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 15,
+ "id": 5,
"label": "text",
"bbox": {
- "l": 174.07,
- "t": 531.29,
- "r": 187.79,
- "b": 600.35,
+ "l": 105.67,
+ "t": 428.0,
+ "r": 126.33,
+ "b": 559.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 91.0,
"cells": [
{
"index": 4,
@@ -4074,36 +4297,36 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 600.35,
- "r_x1": 187.79,
- "r_y1": 600.35,
- "r_x2": 187.79,
- "r_y2": 531.29,
- "r_x3": 174.07,
- "r_y3": 531.29,
+ "r_x0": 126.33,
+ "r_y0": 559.67,
+ "r_x1": 126.33,
+ "r_y1": 428.0,
+ "r_x2": 105.67,
+ "r_y2": 428.0,
+ "r_x3": 105.67,
+ "r_y3": 559.67,
"coord_origin": "TOPLEFT"
},
- "text": "some cells",
- "orig": "some cells",
+ "text": "Other merged",
+ "orig": "Other merged",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 91.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 16,
+ "id": 6,
"label": "text",
"bbox": {
- "l": 174.07,
- "t": 410.9,
- "r": 187.79,
- "b": 494.6,
+ "l": 137.0,
+ "t": 456.0,
+ "r": 153.0,
+ "b": 526.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 5,
@@ -4114,36 +4337,36 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 494.6,
- "r_x1": 187.79,
- "r_y1": 494.6,
- "r_x2": 187.79,
- "r_y2": 410.9,
- "r_x3": 174.07,
- "r_y3": 410.9,
+ "r_x0": 153.0,
+ "r_y0": 526.67,
+ "r_x1": 153.0,
+ "r_y1": 456.0,
+ "r_x2": 137.0,
+ "r_y2": 456.0,
+ "r_x3": 137.0,
+ "r_y3": 526.67,
"coord_origin": "TOPLEFT"
},
- "text": "have content",
- "orig": "have content",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 17,
+ "id": 7,
"label": "text",
"bbox": {
- "l": 174.07,
- "t": 326.21,
- "r": 187.79,
- "b": 350.6,
+ "l": 188.33,
+ "t": 442.33,
+ "r": 204.33,
+ "b": 545.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 6,
@@ -4154,36 +4377,36 @@
"a": 255
},
"rect": {
- "r_x0": 174.07,
- "r_y0": 350.6,
- "r_x1": 187.79,
- "r_y1": 350.6,
- "r_x2": 187.79,
- "r_y2": 326.21,
- "r_x3": 174.07,
- "r_y3": 326.21,
+ "r_x0": 204.33,
+ "r_y0": 545.0,
+ "r_x1": 204.33,
+ "r_y1": 442.33,
+ "r_x2": 188.33,
+ "r_y2": 442.33,
+ "r_x3": 188.33,
+ "r_y3": 545.0,
"coord_origin": "TOPLEFT"
},
- "text": "and",
- "orig": "and",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 18,
+ "id": 8,
"label": "text",
"bbox": {
- "l": 242.7,
- "t": 647.54,
- "r": 256.41,
- "b": 711.73,
+ "l": 220.0,
+ "t": 468.0,
+ "r": 236.0,
+ "b": 515.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 7,
@@ -4194,36 +4417,36 @@
"a": 255
},
"rect": {
- "r_x0": 242.7,
- "r_y0": 711.73,
- "r_x1": 256.41,
- "r_y1": 711.73,
- "r_x2": 256.41,
- "r_y2": 647.54,
- "r_x3": 242.7,
- "r_y3": 647.54,
+ "r_x0": 236.0,
+ "r_y0": 515.0,
+ "r_x1": 236.0,
+ "r_y1": 468.0,
+ "r_x2": 220.0,
+ "r_y2": 468.0,
+ "r_x3": 220.0,
+ "r_y3": 515.0,
"coord_origin": "TOPLEFT"
},
- "text": "and row 1",
- "orig": "and row 1",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 19,
+ "id": 9,
"label": "text",
"bbox": {
- "l": 242.7,
- "t": 435.41,
- "r": 256.41,
- "b": 468.73,
+ "l": 268.0,
+ "t": 442.33,
+ "r": 284.0,
+ "b": 545.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 93.0,
"cells": [
{
"index": 8,
@@ -4234,36 +4457,36 @@
"a": 255
},
"rect": {
- "r_x0": 242.7,
- "r_y0": 468.73,
- "r_x1": 256.41,
- "r_y1": 468.73,
- "r_x2": 256.41,
- "r_y2": 435.41,
- "r_x3": 242.7,
- "r_y3": 435.41,
+ "r_x0": 284.0,
+ "r_y0": 545.0,
+ "r_x1": 284.0,
+ "r_y1": 442.33,
+ "r_x2": 268.0,
+ "r_y2": 442.33,
+ "r_x3": 268.0,
+ "r_y3": 545.0,
"coord_origin": "TOPLEFT"
},
- "text": "other",
- "orig": "other",
+ "text": "Some other",
+ "orig": "Some other",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 93.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 20,
+ "id": 10,
"label": "text",
"bbox": {
- "l": 242.7,
- "t": 323.39,
- "r": 256.41,
- "b": 355.1,
+ "l": 299.67,
+ "t": 468.0,
+ "r": 315.33,
+ "b": 515.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 96.0,
"cells": [
{
"index": 9,
@@ -4274,36 +4497,36 @@
"a": 255
},
"rect": {
- "r_x0": 242.7,
- "r_y0": 355.1,
- "r_x1": 256.41,
- "r_y1": 355.1,
- "r_x2": 256.41,
- "r_y2": 323.39,
- "r_x3": 242.7,
- "r_y3": 323.39,
+ "r_x0": 315.33,
+ "r_y0": 515.0,
+ "r_x1": 315.33,
+ "r_y1": 468.0,
+ "r_x2": 299.67,
+ "r_y2": 468.0,
+ "r_x3": 299.67,
+ "r_y3": 515.0,
"coord_origin": "TOPLEFT"
},
- "text": "have",
- "orig": "have",
+ "text": "value",
+ "orig": "value",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 96.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 21,
+ "id": 11,
"label": "text",
"bbox": {
- "l": 315.82,
- "t": 634.24,
- "r": 329.54,
- "b": 725.23,
+ "l": 105.67,
+ "t": 274.0,
+ "r": 121.67,
+ "b": 385.67,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 10,
@@ -4314,36 +4537,36 @@
"a": 255
},
"rect": {
- "r_x0": 315.82,
- "r_y0": 725.23,
- "r_x1": 329.54,
- "r_y1": 725.23,
- "r_x2": 329.54,
- "r_y2": 634.24,
- "r_x3": 315.82,
- "r_y3": 634.24,
+ "r_x0": 121.67,
+ "r_y0": 385.67,
+ "r_x1": 121.67,
+ "r_y1": 274.0,
+ "r_x2": 105.67,
+ "r_y2": 274.0,
+ "r_x3": 105.67,
+ "r_y3": 385.67,
"coord_origin": "TOPLEFT"
},
- "text": "and last row 2",
- "orig": "and last row 2",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 22,
+ "id": 12,
"label": "text",
"bbox": {
- "l": 315.82,
- "t": 542.27,
- "r": 329.54,
- "b": 590.23,
+ "l": 137.0,
+ "t": 292.67,
+ "r": 153.0,
+ "b": 363.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 94.0,
"cells": [
{
"index": 11,
@@ -4354,36 +4577,36 @@
"a": 255
},
"rect": {
- "r_x0": 315.82,
- "r_y0": 590.23,
- "r_x1": 329.54,
- "r_y1": 590.23,
- "r_x2": 329.54,
- "r_y2": 542.27,
- "r_x3": 315.82,
- "r_y3": 542.27,
+ "r_x0": 153.0,
+ "r_y0": 363.0,
+ "r_x1": 153.0,
+ "r_y1": 292.67,
+ "r_x2": 137.0,
+ "r_y2": 292.67,
+ "r_x3": 137.0,
+ "r_y3": 363.0,
"coord_origin": "TOPLEFT"
},
- "text": "nothing",
- "orig": "nothing",
+ "text": "column",
+ "orig": "column",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 94.0,
+ "from_ocr": true
}
],
"children": []
},
{
- "id": 23,
+ "id": 13,
"label": "text",
"bbox": {
- "l": 315.82,
- "t": 319.15,
- "r": 329.54,
- "b": 357.35,
+ "l": 188.33,
+ "t": 278.0,
+ "r": 204.33,
+ "b": 384.0,
"coord_origin": "TOPLEFT"
},
- "confidence": 1.0,
+ "confidence": 95.0,
"cells": [
{
"index": 12,
@@ -4394,21 +4617,141 @@
"a": 255
},
"rect": {
- "r_x0": 315.82,
- "r_y0": 357.35,
- "r_x1": 329.54,
- "r_y1": 357.35,
- "r_x2": 329.54,
- "r_y2": 319.15,
- "r_x3": 315.82,
- "r_y3": 319.15,
+ "r_x0": 204.33,
+ "r_y0": 384.0,
+ "r_x1": 204.33,
+ "r_y1": 278.0,
+ "r_x2": 188.33,
+ "r_y2": 278.0,
+ "r_x3": 188.33,
+ "r_y3": 384.0,
"coord_origin": "TOPLEFT"
},
- "text": "inside",
- "orig": "inside",
+ "text": "Yet another",
+ "orig": "Yet another",
"text_direction": "left_to_right",
- "confidence": 1.0,
- "from_ocr": false
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 14,
+ "label": "text",
+ "bbox": {
+ "l": 220.0,
+ "t": 304.33,
+ "r": 236.0,
+ "b": 351.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 13,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 236.0,
+ "r_y0": 351.33,
+ "r_x1": 236.0,
+ "r_y1": 304.33,
+ "r_x2": 220.0,
+ "r_y2": 304.33,
+ "r_x3": 220.0,
+ "r_y3": 351.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 15,
+ "label": "text",
+ "bbox": {
+ "l": 268.0,
+ "t": 278.0,
+ "r": 284.0,
+ "b": 383.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 14,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 284.0,
+ "r_y0": 383.67,
+ "r_x1": 284.0,
+ "r_y1": 278.0,
+ "r_x2": 268.0,
+ "r_y2": 278.0,
+ "r_x3": 268.0,
+ "r_y3": 383.67,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "Yet another",
+ "orig": "Yet another",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
+ }
+ ],
+ "children": []
+ },
+ {
+ "id": 16,
+ "label": "text",
+ "bbox": {
+ "l": 299.67,
+ "t": 304.33,
+ "r": 315.33,
+ "b": 351.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "confidence": 95.0,
+ "cells": [
+ {
+ "index": 15,
+ "rgba": {
+ "r": 0,
+ "g": 0,
+ "b": 0,
+ "a": 255
+ },
+ "rect": {
+ "r_x0": 315.33,
+ "r_y0": 351.33,
+ "r_x1": 315.33,
+ "r_y1": 304.33,
+ "r_x2": 299.67,
+ "r_y2": 304.33,
+ "r_x3": 299.67,
+ "r_y3": 351.33,
+ "coord_origin": "TOPLEFT"
+ },
+ "text": "value",
+ "orig": "value",
+ "text_direction": "left_to_right",
+ "confidence": 95.0,
+ "from_ocr": true
}
],
"children": []
@@ -4417,278 +4760,22 @@
},
"text": null,
"otsl_seq": [
- "fcel",
- "fcel",
- "fcel",
- "fcel",
+ "ched",
+ "ched",
+ "ched",
"nl",
"fcel",
"fcel",
"fcel",
- "ecel",
"nl",
"fcel",
"fcel",
- "ecel",
- "fcel",
- "nl",
- "ecel",
- "fcel",
- "fcel",
"fcel",
"nl"
],
- "num_rows": 4,
- "num_cols": 4,
- "table_cells": [
- {
- "bbox": {
- "l": 106.57,
- "t": 534.41,
- "r": 120.29,
- "b": 596.98,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "Column 0",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 106.57,
- "t": 420.78,
- "r": 120.29,
- "b": 483.35,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "Column 1",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 106.57,
- "t": 307.16,
- "r": 120.29,
- "b": 369.73,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 0,
- "end_col_offset_idx": 1,
- "text": "Column 2",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 174.07,
- "t": 641.33,
- "r": 187.79,
- "b": 718.48,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "this is row 0",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 174.07,
- "t": 531.29,
- "r": 187.79,
- "b": 600.35,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "some cells",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 174.07,
- "t": 410.9,
- "r": 187.79,
- "b": 494.6,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "have content",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 174.07,
- "t": 326.21,
- "r": 187.79,
- "b": 350.6,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 1,
- "end_col_offset_idx": 2,
- "text": "and",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 242.7,
- "t": 647.54,
- "r": 256.41,
- "b": 711.73,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "and row 1",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 242.7,
- "t": 435.41,
- "r": 256.41,
- "b": 468.73,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 1,
- "end_row_offset_idx": 2,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "other",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 242.7,
- "t": 323.39,
- "r": 256.41,
- "b": 355.1,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 2,
- "end_col_offset_idx": 3,
- "text": "have",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 315.82,
- "t": 634.24,
- "r": 329.54,
- "b": 725.23,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 3,
- "end_row_offset_idx": 4,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "and last row 2",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 315.82,
- "t": 542.27,
- "r": 329.54,
- "b": 590.23,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 2,
- "end_row_offset_idx": 3,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "nothing",
- "column_header": false,
- "row_header": false,
- "row_section": false
- },
- {
- "bbox": {
- "l": 315.82,
- "t": 319.15,
- "r": 329.54,
- "b": 357.35,
- "coord_origin": "TOPLEFT"
- },
- "row_span": 1,
- "col_span": 1,
- "start_row_offset_idx": 0,
- "end_row_offset_idx": 1,
- "start_col_offset_idx": 3,
- "end_col_offset_idx": 4,
- "text": "inside",
- "column_header": false,
- "row_header": false,
- "row_section": false
- }
- ]
+ "num_rows": 0,
+ "num_cols": 0,
+ "table_cells": []
}
],
"headers": []
diff --git a/tests/data_scanned/ocr_test.pdf b/tests/data_scanned/ocr_test.pdf
index d7f83728..7d14233e 100644
Binary files a/tests/data_scanned/ocr_test.pdf and b/tests/data_scanned/ocr_test.pdf differ
diff --git a/tests/data_scanned/ocr_test_rotated_180.pdf b/tests/data_scanned/ocr_test_rotated_180.pdf
index 22529b46..959da830 100644
Binary files a/tests/data_scanned/ocr_test_rotated_180.pdf and b/tests/data_scanned/ocr_test_rotated_180.pdf differ
diff --git a/tests/data_scanned/ocr_test_rotated_270.pdf b/tests/data_scanned/ocr_test_rotated_270.pdf
index ccf3c612..ebd482db 100644
Binary files a/tests/data_scanned/ocr_test_rotated_270.pdf and b/tests/data_scanned/ocr_test_rotated_270.pdf differ
diff --git a/tests/data_scanned/ocr_test_rotated_90.pdf b/tests/data_scanned/ocr_test_rotated_90.pdf
index 3aa4904b..f1447723 100644
Binary files a/tests/data_scanned/ocr_test_rotated_90.pdf and b/tests/data_scanned/ocr_test_rotated_90.pdf differ
diff --git a/tests/test_e2e_ocr_conversion.py b/tests/test_e2e_ocr_conversion.py
index 22cddf06..e67ea05f 100644
--- a/tests/test_e2e_ocr_conversion.py
+++ b/tests/test_e2e_ocr_conversion.py
@@ -57,24 +57,24 @@ def test_e2e_conversions():
engines: List[Tuple[OcrOptions, bool]] = [
(TesseractOcrOptions(), True),
- # (TesseractCliOcrOptions(), True),
- # (EasyOcrOptions(), False),
- # (TesseractOcrOptions(force_full_page_ocr=True), True),
- # (TesseractOcrOptions(force_full_page_ocr=True, lang=["auto"]), True),
- # (TesseractCliOcrOptions(force_full_page_ocr=True), True),
- # (TesseractCliOcrOptions(force_full_page_ocr=True, lang=["auto"]), True),
- # (EasyOcrOptions(force_full_page_ocr=True), False),
+ (TesseractCliOcrOptions(), True),
+ (EasyOcrOptions(), False),
+ (TesseractOcrOptions(force_full_page_ocr=True), True),
+ (TesseractOcrOptions(force_full_page_ocr=True, lang=["auto"]), True),
+ (TesseractCliOcrOptions(force_full_page_ocr=True), True),
+ (TesseractCliOcrOptions(force_full_page_ocr=True, lang=["auto"]), True),
+ (EasyOcrOptions(force_full_page_ocr=True), False),
]
- #
- # # rapidocr is only available for Python >=3.6,<3.13
- # if sys.version_info < (3, 13):
- # engines.append((RapidOcrOptions(), False))
- # engines.append((RapidOcrOptions(force_full_page_ocr=True), False))
- #
- # # only works on mac
- # if "darwin" == sys.platform:
- # engines.append((OcrMacOptions(), True))
- # engines.append((OcrMacOptions(force_full_page_ocr=True), True))
+
+ # rapidocr is only available for Python >=3.6,<3.13
+ if sys.version_info < (3, 13):
+ engines.append((RapidOcrOptions(), False))
+ engines.append((RapidOcrOptions(force_full_page_ocr=True), False))
+
+ # only works on mac
+ if "darwin" == sys.platform:
+ engines.append((OcrMacOptions(), False))
+ engines.append((OcrMacOptions(force_full_page_ocr=True), False))
for ocr_options, supports_rotation in engines:
print(