diff --git a/docling/models/layout_model.py b/docling/models/layout_model.py index f9127307..b06c5adf 100644 --- a/docling/models/layout_model.py +++ b/docling/models/layout_model.py @@ -102,12 +102,7 @@ class LayoutModel(BasePageModel): ) def draw_clusters_and_cells_side_by_side( - self, - conv_res, - page, - clusters, - mode_prefix: str, - show: bool = False, + self, conv_res, page, clusters, mode_prefix: str, show: bool = False ): """ Draws a page image side by side with clusters filtered into two categories: @@ -115,9 +110,9 @@ class LayoutModel(BasePageModel): - Right: Clusters including FORM, KEY_VALUE_REGION, and PICTURE. Includes label names and confidence scores for each cluster. """ - page_image = deepcopy(page.image) - scale_x = page_image.width / page.size.width - scale_y = page_image.height / page.size.height + scale_x = page.image.width / page.size.width + scale_y = page.image.height / page.size.height + # Filter clusters for left and right images exclude_labels = { DocItemLabel.FORM, @@ -127,8 +122,8 @@ class LayoutModel(BasePageModel): left_clusters = [c for c in clusters if c.label not in exclude_labels] right_clusters = [c for c in clusters if c.label in exclude_labels] # Create a deep copy of the original image for both sides - left_image = page_image - right_image = copy.deepcopy(left_image) + left_image = copy.deepcopy(page.image) + right_image = copy.deepcopy(page.image) # Draw clusters on both images draw_clusters(left_image, left_clusters, scale_x, scale_y) @@ -191,10 +186,7 @@ class LayoutModel(BasePageModel): if settings.debug.visualize_raw_layout: self.draw_clusters_and_cells_side_by_side( - conv_res, - page, - clusters, - mode_prefix="raw", + conv_res, page, clusters, mode_prefix="raw" ) # Apply postprocessing @@ -228,10 +220,7 @@ class LayoutModel(BasePageModel): if settings.debug.visualize_layout: self.draw_clusters_and_cells_side_by_side( - conv_res, - page, - processed_clusters, - mode_prefix="postprocessed", + conv_res, page, processed_clusters, mode_prefix="postprocessed" ) yield page diff --git a/docling/models/ocr_mac_model.py b/docling/models/ocr_mac_model.py index 609b1240..6f90af23 100644 --- a/docling/models/ocr_mac_model.py +++ b/docling/models/ocr_mac_model.py @@ -107,10 +107,10 @@ class OcrMacModel(BaseOcrModel): x2 = x1 + w * im_width y1 = y2 - h * im_height - left = x1 / self.scale - top = y1 / self.scale - right = x2 / self.scale - bottom = y2 / self.scale + left = x1 / self.scale + ocr_rect.l + top = y1 / self.scale + ocr_rect.t + right = x2 / self.scale + ocr_rect.l + bottom = y2 / self.scale + ocr_rect.t cells.append( TextCell( diff --git a/docling/models/table_structure_model.py b/docling/models/table_structure_model.py index 05153ff9..2904b6ed 100644 --- a/docling/models/table_structure_model.py +++ b/docling/models/table_structure_model.py @@ -260,7 +260,7 @@ class TableStructureModel(BasePageModel): ) new_bbox = _rotate_bbox( new_cell.to_bounding_box(), - orientation=-cells_orientation, + orientation=cells_orientation, im_size=scaled_page_im.size, ).model_dump() tokens.append( diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test.doctags.txt b/tests/data_scanned/groundtruth/docling_v1/ocr_test.doctags.txt index 19f5c6aa..20604b3e 100644 --- a/tests/data_scanned/groundtruth/docling_v1/ocr_test.doctags.txt +++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test.doctags.txt @@ -1,11 +1,8 @@ -This is a table test -The test starts with some random text and then a table image: -Some column -Some other column -Some row -some cell -have content -Some other row -other don't + + +Vertically mergedOther merged columnYet another column +valueSome other valueYet another value +valueSome other valueYet another value +
\ No newline at end of file diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test.json b/tests/data_scanned/groundtruth/docling_v1/ocr_test.json index 20934507..81ad10e7 100644 --- a/tests/data_scanned/groundtruth/docling_v1/ocr_test.json +++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test.json @@ -27,13 +27,13 @@ "file-info": { "filename": "ocr_test.pdf", "filename-prov": null, - "document-hash": "4220c26a23a085eeca7ed3904ae0952e7e73458e65ce19e56170a9ce095b2313", + "document-hash": "0f391d12850f72bb91897f7f3bebfd4a0a8357e2a883ac1f664e32342c04e418", "#-pages": 1, "collection-name": null, "description": null, "page-hashes": [ { - "hash": "07ff68c95cc6ec01fb38d02dc5d5efc466f3cfbf2e1dcb6c16b4e722d7f9f657", + "hash": "32f328168da3f69890a725c1168799f9ff7337249e98b1f36c12965551477be5", "model": "default", "page": 1 } @@ -41,223 +41,307 @@ }, "main-text": [ { - "prov": [ - { - "bbox": [ - 201.26343, - 690.10254, - 417.96021, - 719.14941 - ], - "page": 1, - "span": [ - 0, - 20 - ], - "__ref_s3_data": null - } - ], - "text": "This is a table test", - "type": "subtitle-level-1", - "payload": null, - "name": "Section-header", - "font": null - }, - { - "prov": [ - { - "bbox": [ - 72.0, - 655.42273, - 376.27319, - 667.7117899999998 - ], - "page": 1, - "span": [ - 0, - 61 - ], - "__ref_s3_data": null - } - ], - "text": "The test starts with some random text and then a table image:", - "type": "paragraph", - "payload": null, - "name": "Text", - "font": null - }, - { - "prov": [ - { - "bbox": [ - 275.33333333333337, - 601.0, - 343.66666666666663, - 609.6666666666666 - ], - "page": 1, - "span": [ - 0, - 11 - ], - "__ref_s3_data": null - } - ], - "text": "Some column", - "type": "paragraph", - "payload": null, - "name": "Text", - "font": null - }, - { - "prov": [ - { - "bbox": [ - 381.3333333333333, - 601.0, - 479.3333333333333, - 609.6666666666666 - ], - "page": 1, - "span": [ - 0, - 17 - ], - "__ref_s3_data": null - } - ], - "text": "Some other column", - "type": "paragraph", - "payload": null, - "name": "Text", - "font": null - }, - { - "prov": [ - { - "bbox": [ - 175.0, - 554.6666666666667, - 225.66666666666669, - 563.3333333333333 - ], - "page": 1, - "span": [ - 0, - 8 - ], - "__ref_s3_data": null - } - ], - "text": "Some row", - "type": "paragraph", - "payload": null, - "name": "Text", - "font": null - }, - { - "prov": [ - { - "bbox": [ - 286.0, - 554.6666666666667, - 333.0, - 563.3333333333333 - ], - "page": 1, - "span": [ - 0, - 9 - ], - "__ref_s3_data": null - } - ], - "text": "some cell", - "type": "paragraph", - "payload": null, - "name": "Text", - "font": null - }, - { - "prov": [ - { - "bbox": [ - 398.3333333333333, - 554.6666666666667, - 463.0, - 563.3333333333333 - ], - "page": 1, - "span": [ - 0, - 12 - ], - "__ref_s3_data": null - } - ], - "text": "have content", - "type": "paragraph", - "payload": null, - "name": "Text", - "font": null - }, - { - "prov": [ - { - "bbox": [ - 160.33333333333334, - 508.33333333333337, - 240.33333333333331, - 517.0 - ], - "page": 1, - "span": [ - 0, - 14 - ], - "__ref_s3_data": null - } - ], - "text": "Some other row", - "type": "paragraph", - "payload": null, - "name": "Text", - "font": null - }, - { - "prov": [ - { - "bbox": [ - 283.0, - 508.33333333333337, - 336.33333333333337, - 517.0 - ], - "page": 1, - "span": [ - 0, - 11 - ], - "__ref_s3_data": null - } - ], - "text": "other don't", - "type": "paragraph", - "payload": null, - "name": "Text", - "font": null + "name": "Table", + "type": "table", + "$ref": "#/tables/0" } ], "figures": [], - "tables": [], + "tables": [ + { + "prov": [ + { + "bbox": [ + 69.04969024658203, + 277.41973876953125, + 551.0990600585938, + 524.3504486083984 + ], + "page": 1, + "span": [ + 0, + 0 + ], + "__ref_s3_data": null + } + ], + "text": "", + "type": "table", + "payload": null, + "#-cols": 3, + "#-rows": 3, + "data": [ + [ + { + "bbox": [ + 97.33333333333333, + 105.66666666666666, + 190.0, + 126.33333333333334 + ], + "spans": [ + [ + 0, + 0 + ] + ], + "text": "Vertically merged", + "type": "col_header", + "col": 0, + "col-header": true, + "col-span": [ + 0, + 1 + ], + "row": 0, + "row-header": false, + "row-span": [ + 0, + 1 + ] + }, + { + "bbox": [ + 232.66666666666666, + 105.66666666666666, + 364.0, + 126.33333333333334 + ], + "spans": [ + [ + 0, + 1 + ] + ], + "text": "Other merged column", + "type": "col_header", + "col": 1, + "col-header": true, + "col-span": [ + 1, + 2 + ], + "row": 0, + "row-header": false, + "row-span": [ + 0, + 1 + ] + }, + { + "bbox": [ + 406.3333333333333, + 105.66666666666666, + 518.3333333333333, + 121.66666666666666 + ], + "spans": [ + [ + 0, + 2 + ] + ], + "text": "Yet another column", + "type": "col_header", + "col": 2, + "col-header": true, + "col-span": [ + 2, + 3 + ], + "row": 0, + "row-header": false, + "row-span": [ + 0, + 1 + ] + } + ], + [ + { + "bbox": [ + 121.66666666666667, + 204.33333333333334, + 168.66666666666666, + 220.0 + ], + "spans": [ + [ + 1, + 0 + ] + ], + "text": "value", + "type": "body", + "col": 0, + "col-header": false, + "col-span": [ + 0, + 1 + ], + "row": 1, + "row-header": false, + "row-span": [ + 1, + 2 + ] + }, + { + "bbox": [ + 247.0, + 188.33333333333331, + 349.6666666666667, + 204.33333333333334 + ], + "spans": [ + [ + 1, + 1 + ] + ], + "text": "Some other value", + "type": "body", + "col": 1, + "col-header": false, + "col-span": [ + 1, + 2 + ], + "row": 1, + "row-header": false, + "row-span": [ + 1, + 2 + ] + }, + { + "bbox": [ + 408.3333333333333, + 188.33333333333331, + 514.0, + 204.33333333333334 + ], + "spans": [ + [ + 1, + 2 + ] + ], + "text": "Yet another value", + "type": "body", + "col": 2, + "col-header": false, + "col-span": [ + 2, + 3 + ], + "row": 1, + "row-header": false, + "row-span": [ + 1, + 2 + ] + } + ], + [ + { + "bbox": [ + 121.66666666666667, + 284.0, + 168.66666666666666, + 300.0 + ], + "spans": [ + [ + 2, + 0 + ] + ], + "text": "value", + "type": "body", + "col": 0, + "col-header": false, + "col-span": [ + 0, + 1 + ], + "row": 2, + "row-header": false, + "row-span": [ + 2, + 3 + ] + }, + { + "bbox": [ + 247.0, + 268.0, + 349.6666666666667, + 284.0 + ], + "spans": [ + [ + 2, + 1 + ] + ], + "text": "Some other value", + "type": "body", + "col": 1, + "col-header": false, + "col-span": [ + 1, + 2 + ], + "row": 2, + "row-header": false, + "row-span": [ + 2, + 3 + ] + }, + { + "bbox": [ + 408.3333333333333, + 268.0, + 514.0, + 284.0 + ], + "spans": [ + [ + 2, + 2 + ] + ], + "text": "Yet another value", + "type": "body", + "col": 2, + "col-header": false, + "col-span": [ + 2, + 3 + ], + "row": 2, + "row-header": false, + "row-span": [ + 2, + 3 + ] + } + ] + ], + "model": null, + "bounding-box": null + } + ], "bitmaps": null, "equations": [], "footnotes": [], "page-dimensions": [ { - "height": 792.0, + "height": 612.0, "page": 1, - "width": 612.0 + "width": 792.0 } ], "page-footers": [], diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test.md b/tests/data_scanned/groundtruth/docling_v1/ocr_test.md index c466de2b..e3d7c0b8 100644 --- a/tests/data_scanned/groundtruth/docling_v1/ocr_test.md +++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test.md @@ -1,5 +1,4 @@ -| | Column 0 | Column 1 | Column 2 | -|----------------|------------|--------------|------------| -| this is row 0 | some cells | have content | and | -| and row 1 | | other | have | -| and last row 2 | nothing | | inside | \ No newline at end of file +| Vertically merged | Other merged column | Yet another column | +|---------------------|-----------------------|----------------------| +| value | Some other value | Yet another value | +| value | Some other value | Yet another value | \ No newline at end of file diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test.pages.json b/tests/data_scanned/groundtruth/docling_v1/ocr_test.pages.json index 8bfcaa25..f9ed59fd 100644 --- a/tests/data_scanned/groundtruth/docling_v1/ocr_test.pages.json +++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test.pages.json @@ -2,8 +2,8 @@ { "page_no": 0, "size": { - "width": 612.0, - "height": 792.0 + "width": 792.0, + "height": 612.0 }, "parsed_page": { "dimension": { @@ -11,47 +11,47 @@ "rect": { "r_x0": 0.0, "r_y0": 0.0, - "r_x1": 612.0, + "r_x1": 792.0, "r_y1": 0.0, - "r_x2": 612.0, - "r_y2": 792.0, + "r_x2": 792.0, + "r_y2": 612.0, "r_x3": 0.0, - "r_y3": 792.0, + "r_y3": 612.0, "coord_origin": "BOTTOMLEFT" }, "boundary_type": "crop_box", "art_bbox": { "l": 0.0, - "t": 792.0, - "r": 612.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" }, "bleed_bbox": { "l": 0.0, - "t": 792.0, - "r": 612.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" }, "crop_bbox": { "l": 0.0, - "t": 792.0, - "r": 612.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" }, "media_bbox": { "l": 0.0, - "t": 792.0, - "r": 612.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" }, "trim_bbox": { "l": 0.0, - "t": 792.0, - "r": 612.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" } @@ -69,21 +69,21 @@ "a": 255 }, "rect": { - "r_x0": 201.26343, - "r_y0": 101.89746000000002, - "r_x1": 417.96021, - "r_y1": 101.89746000000002, - "r_x2": 417.96021, - "r_y2": 72.85059000000001, - "r_x3": 201.26343, - "r_y3": 72.85059000000001, + "r_x0": 97.33333333333333, + "r_y0": 126.33333333333334, + "r_x1": 190.0, + "r_y1": 126.33333333333334, + "r_x2": 190.0, + "r_y2": 105.66666666666666, + "r_x3": 97.33333333333333, + "r_y3": 105.66666666666666, "coord_origin": "TOPLEFT" }, - "text": "This is a table test ", - "orig": "This is a table test ", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 89.0, + "from_ocr": true }, { "index": 1, @@ -94,21 +94,21 @@ "a": 255 }, "rect": { - "r_x0": 72.0, - "r_y0": 136.57727, - "r_x1": 376.27319, - "r_y1": 136.57727, - "r_x2": 376.27319, - "r_y2": 124.28821000000016, - "r_x3": 72.0, - "r_y3": 124.28821000000016, + "r_x0": 112.0, + "r_y0": 157.66666666666669, + "r_x1": 182.33333333333334, + "r_y1": 157.66666666666669, + "r_x2": 182.33333333333334, + "r_y2": 137.0, + "r_x3": 112.0, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "The test starts with some random text and then a table image: ", - "orig": "The test starts with some random text and then a table image: ", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 2, @@ -119,20 +119,20 @@ "a": 255 }, "rect": { - "r_x0": 275.33333333333337, - "r_y0": 191.0, - "r_x1": 304.0, - "r_y1": 191.0, - "r_x2": 304.0, - "r_y2": 182.33333333333334, - "r_x3": 275.33333333333337, - "r_y3": 182.33333333333334, + "r_x0": 121.66666666666667, + "r_y0": 220.0, + "r_x1": 168.66666666666666, + "r_y1": 220.0, + "r_x2": 168.66666666666666, + "r_y2": 204.33333333333334, + "r_x3": 121.66666666666667, + "r_y3": 204.33333333333334, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9609484899999999, + "confidence": 96.0, "from_ocr": true }, { @@ -144,20 +144,20 @@ "a": 255 }, "rect": { - "r_x0": 308.0, - "r_y0": 191.0, - "r_x1": 343.66666666666663, - "r_y1": 191.0, - "r_x2": 343.66666666666663, - "r_y2": 182.33333333333334, - "r_x3": 308.0, - "r_y3": 182.33333333333334, + "r_x0": 121.66666666666667, + "r_y0": 300.0, + "r_x1": 168.66666666666666, + "r_y1": 300.0, + "r_x2": 168.66666666666666, + "r_y2": 284.0, + "r_x3": 121.66666666666667, + "r_y3": 284.0, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.95935837, + "confidence": 96.0, "from_ocr": true }, { @@ -169,20 +169,20 @@ "a": 255 }, "rect": { - "r_x0": 381.3333333333333, - "r_y0": 191.0, - "r_x1": 410.3333333333333, - "r_y1": 191.0, - "r_x2": 410.3333333333333, - "r_y2": 182.33333333333334, - "r_x3": 381.3333333333333, - "r_y3": 182.33333333333334, + "r_x0": 232.66666666666666, + "r_y0": 126.33333333333334, + "r_x1": 364.0, + "r_y1": 126.33333333333334, + "r_x2": 364.0, + "r_y2": 105.66666666666666, + "r_x3": 232.66666666666666, + "r_y3": 105.66666666666666, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 0.95280136, + "confidence": 92.0, "from_ocr": true }, { @@ -194,20 +194,20 @@ "a": 255 }, "rect": { - "r_x0": 414.3333333333333, - "r_y0": 191.0, - "r_x1": 440.3333333333333, - "r_y1": 191.0, - "r_x2": 440.3333333333333, - "r_y2": 182.33333333333334, - "r_x3": 414.3333333333333, - "r_y3": 182.33333333333334, + "r_x0": 265.66666666666663, + "r_y0": 153.0, + "r_x1": 336.0, + "r_y1": 153.0, + "r_x2": 336.0, + "r_y2": 137.0, + "r_x3": 265.66666666666663, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9649115, + "confidence": 94.0, "from_ocr": true }, { @@ -219,20 +219,20 @@ "a": 255 }, "rect": { - "r_x0": 443.3333333333333, - "r_y0": 191.0, - "r_x1": 479.3333333333333, - "r_y1": 191.0, - "r_x2": 479.3333333333333, - "r_y2": 182.33333333333334, - "r_x3": 443.3333333333333, - "r_y3": 182.33333333333334, + "r_x0": 247.0, + "r_y0": 204.33333333333334, + "r_x1": 349.6666666666667, + "r_y1": 204.33333333333334, + "r_x2": 349.6666666666667, + "r_y2": 188.33333333333331, + "r_x3": 247.0, + "r_y3": 188.33333333333331, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.9639427899999999, + "confidence": 94.0, "from_ocr": true }, { @@ -244,20 +244,20 @@ "a": 255 }, "rect": { - "r_x0": 175.0, - "r_y0": 237.33333333333331, - "r_x1": 204.0, - "r_y1": 237.33333333333331, - "r_x2": 204.0, - "r_y2": 228.66666666666669, - "r_x3": 175.0, - "r_y3": 228.66666666666669, + "r_x0": 277.0, + "r_y0": 236.0, + "r_x1": 324.3333333333333, + "r_y1": 236.0, + "r_x2": 324.3333333333333, + "r_y2": 220.0, + "r_x3": 277.0, + "r_y3": 220.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96050453, + "confidence": 96.0, "from_ocr": true }, { @@ -269,20 +269,20 @@ "a": 255 }, "rect": { - "r_x0": 208.0, - "r_y0": 237.33333333333331, - "r_x1": 225.66666666666669, - "r_y1": 237.33333333333331, - "r_x2": 225.66666666666669, - "r_y2": 231.0, - "r_x3": 208.0, - "r_y3": 231.0, + "r_x0": 247.0, + "r_y0": 284.0, + "r_x1": 349.6666666666667, + "r_y1": 284.0, + "r_x2": 349.6666666666667, + "r_y2": 268.0, + "r_x3": 247.0, + "r_y3": 268.0, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.9623416899999999, + "confidence": 92.0, "from_ocr": true }, { @@ -294,20 +294,20 @@ "a": 255 }, "rect": { - "r_x0": 286.0, - "r_y0": 237.33333333333331, - "r_x1": 313.0, - "r_y1": 237.33333333333331, - "r_x2": 313.0, - "r_y2": 231.0, - "r_x3": 286.0, - "r_y3": 231.0, + "r_x0": 277.0, + "r_y0": 315.33333333333337, + "r_x1": 324.3333333333333, + "r_y1": 315.33333333333337, + "r_x2": 324.3333333333333, + "r_y2": 299.66666666666663, + "r_x3": 277.0, + "r_y3": 299.66666666666663, "coord_origin": "TOPLEFT" }, - "text": "some", - "orig": "some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96279846, + "confidence": 96.0, "from_ocr": true }, { @@ -319,20 +319,20 @@ "a": 255 }, "rect": { - "r_x0": 317.0, - "r_y0": 237.33333333333331, - "r_x1": 333.0, - "r_y1": 237.33333333333331, - "r_x2": 333.0, - "r_y2": 228.66666666666669, - "r_x3": 317.0, - "r_y3": 228.66666666666669, + "r_x0": 406.3333333333333, + "r_y0": 121.66666666666666, + "r_x1": 518.3333333333333, + "r_y1": 121.66666666666666, + "r_x2": 518.3333333333333, + "r_y2": 105.66666666666666, + "r_x3": 406.3333333333333, + "r_y3": 105.66666666666666, "coord_origin": "TOPLEFT" }, - "text": "cell", - "orig": "cell", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.96231712, + "confidence": 96.0, "from_ocr": true }, { @@ -344,20 +344,20 @@ "a": 255 }, "rect": { - "r_x0": 398.3333333333333, - "r_y0": 237.33333333333331, - "r_x1": 422.0, - "r_y1": 237.33333333333331, - "r_x2": 422.0, - "r_y2": 228.66666666666669, - "r_x3": 398.3333333333333, - "r_y3": 228.66666666666669, + "r_x0": 429.3333333333333, + "r_y0": 153.0, + "r_x1": 499.3333333333333, + "r_y1": 153.0, + "r_x2": 499.3333333333333, + "r_y2": 137.0, + "r_x3": 429.3333333333333, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.96670181, + "confidence": 94.0, "from_ocr": true }, { @@ -369,20 +369,20 @@ "a": 255 }, "rect": { - "r_x0": 426.0, - "r_y0": 237.33333333333331, - "r_x1": 463.0, - "r_y1": 237.33333333333331, - "r_x2": 463.0, - "r_y2": 229.0, - "r_x3": 426.0, - "r_y3": 229.0, + "r_x0": 408.3333333333333, + "r_y0": 204.33333333333334, + "r_x1": 514.0, + "r_y1": 204.33333333333334, + "r_x2": 514.0, + "r_y2": 188.33333333333331, + "r_x3": 408.3333333333333, + "r_y3": 188.33333333333331, "coord_origin": "TOPLEFT" }, - "text": "content", - "orig": "content", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.9589679700000001, + "confidence": 95.0, "from_ocr": true }, { @@ -394,20 +394,20 @@ "a": 255 }, "rect": { - "r_x0": 160.33333333333334, - "r_y0": 283.66666666666663, - "r_x1": 189.33333333333331, - "r_y1": 283.66666666666663, - "r_x2": 189.33333333333331, - "r_y2": 275.0, - "r_x3": 160.33333333333334, - "r_y3": 275.0, + "r_x0": 440.6666666666667, + "r_y0": 236.0, + "r_x1": 487.6666666666667, + "r_y1": 236.0, + "r_x2": 487.6666666666667, + "r_y2": 220.0, + "r_x3": 440.6666666666667, + "r_y3": 220.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.95674171, + "confidence": 95.0, "from_ocr": true }, { @@ -419,20 +419,20 @@ "a": 255 }, "rect": { - "r_x0": 193.0, - "r_y0": 283.66666666666663, - "r_x1": 219.0, - "r_y1": 283.66666666666663, - "r_x2": 219.0, - "r_y2": 275.0, - "r_x3": 193.0, - "r_y3": 275.0, + "r_x0": 408.3333333333333, + "r_y0": 284.0, + "r_x1": 514.0, + "r_y1": 284.0, + "r_x2": 514.0, + "r_y2": 268.0, + "r_x3": 408.3333333333333, + "r_y3": 268.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.9601168099999999, + "confidence": 95.0, "from_ocr": true }, { @@ -444,70 +444,20 @@ "a": 255 }, "rect": { - "r_x0": 222.66666666666669, - "r_y0": 283.66666666666663, - "r_x1": 240.33333333333331, - "r_y1": 283.66666666666663, - "r_x2": 240.33333333333331, - "r_y2": 277.33333333333337, - "r_x3": 222.66666666666669, - "r_y3": 277.33333333333337, + "r_x0": 440.6666666666667, + "r_y0": 315.33333333333337, + "r_x1": 487.6666666666667, + "r_y1": 315.33333333333337, + "r_x2": 487.6666666666667, + "r_y2": 299.66666666666663, + "r_x3": 440.6666666666667, + "r_y3": 299.66666666666663, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96364174, - "from_ocr": true - }, - { - "index": 16, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 283.0, - "r_y0": 283.66666666666663, - "r_x1": 309.0, - "r_y1": 283.66666666666663, - "r_x2": 309.0, - "r_y2": 275.0, - "r_x3": 283.0, - "r_y3": 275.0, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.9636872099999999, - "from_ocr": true - }, - { - "index": 17, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 312.33333333333337, - "r_y0": 283.66666666666663, - "r_x1": 336.33333333333337, - "r_y1": 283.66666666666663, - "r_x2": 336.33333333333337, - "r_y2": 275.0, - "r_x3": 312.33333333333337, - "r_y3": 275.0, - "coord_origin": "TOPLEFT" - }, - "text": "don't", - "orig": "don't", - "text_direction": "left_to_right", - "confidence": 0.9636872099999999, + "confidence": 95.0, "from_ocr": true } ], @@ -521,16 +471,16 @@ "layout": { "clusters": [ { - "id": 9, - "label": "section_header", + "id": 0, + "label": "table", "bbox": { - "l": 201.26343, - "t": 72.85059000000001, - "r": 417.96021, - "b": 101.89746000000002, + "l": 69.04969024658203, + "t": 87.64955139160156, + "r": 551.0990600585938, + "b": 334.58026123046875, "coord_origin": "TOPLEFT" }, - "confidence": 0.6777006387710571, + "confidence": 0.9790865778923035, "cells": [ { "index": 0, @@ -541,37 +491,22 @@ "a": 255 }, "rect": { - "r_x0": 201.26343, - "r_y0": 101.89746000000002, - "r_x1": 417.96021, - "r_y1": 101.89746000000002, - "r_x2": 417.96021, - "r_y2": 72.85059000000001, - "r_x3": 201.26343, - "r_y3": 72.85059000000001, + "r_x0": 97.33333333333333, + "r_y0": 126.33333333333334, + "r_x1": 190.0, + "r_y1": 126.33333333333334, + "r_x2": 190.0, + "r_y2": 105.66666666666666, + "r_x3": 97.33333333333333, + "r_y3": 105.66666666666666, "coord_origin": "TOPLEFT" }, - "text": "This is a table test ", - "orig": "This is a table test ", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - } - ], - "children": [] - }, - { - "id": 7, - "label": "text", - "bbox": { - "l": 72.0, - "t": 124.28821000000016, - "r": 376.27319, - "b": 136.57727, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.8428522944450378, - "cells": [ + "confidence": 89.0, + "from_ocr": true + }, { "index": 1, "rgba": { @@ -581,37 +516,22 @@ "a": 255 }, "rect": { - "r_x0": 72.0, - "r_y0": 136.57727, - "r_x1": 376.27319, - "r_y1": 136.57727, - "r_x2": 376.27319, - "r_y2": 124.28821000000016, - "r_x3": 72.0, - "r_y3": 124.28821000000016, + "r_x0": 112.0, + "r_y0": 157.66666666666669, + "r_x1": 182.33333333333334, + "r_y1": 157.66666666666669, + "r_x2": 182.33333333333334, + "r_y2": 137.0, + "r_x3": 112.0, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "The test starts with some random text and then a table image: ", - "orig": "The test starts with some random text and then a table image: ", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - } - ], - "children": [] - }, - { - "id": 8, - "label": "form", - "bbox": { - "l": 160.33333333333334, - "t": 182.33333333333334, - "r": 479.3333333333333, - "b": 283.66666666666663, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.7274590134620667, - "cells": [ + "confidence": 92.0, + "from_ocr": true + }, { "index": 2, "rgba": { @@ -621,20 +541,20 @@ "a": 255 }, "rect": { - "r_x0": 275.33333333333337, - "r_y0": 191.0, - "r_x1": 304.0, - "r_y1": 191.0, - "r_x2": 304.0, - "r_y2": 182.33333333333334, - "r_x3": 275.33333333333337, - "r_y3": 182.33333333333334, + "r_x0": 121.66666666666667, + "r_y0": 220.0, + "r_x1": 168.66666666666666, + "r_y1": 220.0, + "r_x2": 168.66666666666666, + "r_y2": 204.33333333333334, + "r_x3": 121.66666666666667, + "r_y3": 204.33333333333334, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9609484899999999, + "confidence": 96.0, "from_ocr": true }, { @@ -646,20 +566,20 @@ "a": 255 }, "rect": { - "r_x0": 308.0, - "r_y0": 191.0, - "r_x1": 343.66666666666663, - "r_y1": 191.0, - "r_x2": 343.66666666666663, - "r_y2": 182.33333333333334, - "r_x3": 308.0, - "r_y3": 182.33333333333334, + "r_x0": 121.66666666666667, + "r_y0": 300.0, + "r_x1": 168.66666666666666, + "r_y1": 300.0, + "r_x2": 168.66666666666666, + "r_y2": 284.0, + "r_x3": 121.66666666666667, + "r_y3": 284.0, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.95935837, + "confidence": 96.0, "from_ocr": true }, { @@ -671,20 +591,20 @@ "a": 255 }, "rect": { - "r_x0": 381.3333333333333, - "r_y0": 191.0, - "r_x1": 410.3333333333333, - "r_y1": 191.0, - "r_x2": 410.3333333333333, - "r_y2": 182.33333333333334, - "r_x3": 381.3333333333333, - "r_y3": 182.33333333333334, + "r_x0": 232.66666666666666, + "r_y0": 126.33333333333334, + "r_x1": 364.0, + "r_y1": 126.33333333333334, + "r_x2": 364.0, + "r_y2": 105.66666666666666, + "r_x3": 232.66666666666666, + "r_y3": 105.66666666666666, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 0.95280136, + "confidence": 92.0, "from_ocr": true }, { @@ -696,20 +616,20 @@ "a": 255 }, "rect": { - "r_x0": 414.3333333333333, - "r_y0": 191.0, - "r_x1": 440.3333333333333, - "r_y1": 191.0, - "r_x2": 440.3333333333333, - "r_y2": 182.33333333333334, - "r_x3": 414.3333333333333, - "r_y3": 182.33333333333334, + "r_x0": 265.66666666666663, + "r_y0": 153.0, + "r_x1": 336.0, + "r_y1": 153.0, + "r_x2": 336.0, + "r_y2": 137.0, + "r_x3": 265.66666666666663, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9649115, + "confidence": 94.0, "from_ocr": true }, { @@ -721,20 +641,20 @@ "a": 255 }, "rect": { - "r_x0": 443.3333333333333, - "r_y0": 191.0, - "r_x1": 479.3333333333333, - "r_y1": 191.0, - "r_x2": 479.3333333333333, - "r_y2": 182.33333333333334, - "r_x3": 443.3333333333333, - "r_y3": 182.33333333333334, + "r_x0": 247.0, + "r_y0": 204.33333333333334, + "r_x1": 349.6666666666667, + "r_y1": 204.33333333333334, + "r_x2": 349.6666666666667, + "r_y2": 188.33333333333331, + "r_x3": 247.0, + "r_y3": 188.33333333333331, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.9639427899999999, + "confidence": 94.0, "from_ocr": true }, { @@ -746,20 +666,20 @@ "a": 255 }, "rect": { - "r_x0": 175.0, - "r_y0": 237.33333333333331, - "r_x1": 204.0, - "r_y1": 237.33333333333331, - "r_x2": 204.0, - "r_y2": 228.66666666666669, - "r_x3": 175.0, - "r_y3": 228.66666666666669, + "r_x0": 277.0, + "r_y0": 236.0, + "r_x1": 324.3333333333333, + "r_y1": 236.0, + "r_x2": 324.3333333333333, + "r_y2": 220.0, + "r_x3": 277.0, + "r_y3": 220.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96050453, + "confidence": 96.0, "from_ocr": true }, { @@ -771,20 +691,20 @@ "a": 255 }, "rect": { - "r_x0": 208.0, - "r_y0": 237.33333333333331, - "r_x1": 225.66666666666669, - "r_y1": 237.33333333333331, - "r_x2": 225.66666666666669, - "r_y2": 231.0, - "r_x3": 208.0, - "r_y3": 231.0, + "r_x0": 247.0, + "r_y0": 284.0, + "r_x1": 349.6666666666667, + "r_y1": 284.0, + "r_x2": 349.6666666666667, + "r_y2": 268.0, + "r_x3": 247.0, + "r_y3": 268.0, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.9623416899999999, + "confidence": 92.0, "from_ocr": true }, { @@ -796,20 +716,20 @@ "a": 255 }, "rect": { - "r_x0": 286.0, - "r_y0": 237.33333333333331, - "r_x1": 313.0, - "r_y1": 237.33333333333331, - "r_x2": 313.0, - "r_y2": 231.0, - "r_x3": 286.0, - "r_y3": 231.0, + "r_x0": 277.0, + "r_y0": 315.33333333333337, + "r_x1": 324.3333333333333, + "r_y1": 315.33333333333337, + "r_x2": 324.3333333333333, + "r_y2": 299.66666666666663, + "r_x3": 277.0, + "r_y3": 299.66666666666663, "coord_origin": "TOPLEFT" }, - "text": "some", - "orig": "some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96279846, + "confidence": 96.0, "from_ocr": true }, { @@ -821,20 +741,20 @@ "a": 255 }, "rect": { - "r_x0": 317.0, - "r_y0": 237.33333333333331, - "r_x1": 333.0, - "r_y1": 237.33333333333331, - "r_x2": 333.0, - "r_y2": 228.66666666666669, - "r_x3": 317.0, - "r_y3": 228.66666666666669, + "r_x0": 406.3333333333333, + "r_y0": 121.66666666666666, + "r_x1": 518.3333333333333, + "r_y1": 121.66666666666666, + "r_x2": 518.3333333333333, + "r_y2": 105.66666666666666, + "r_x3": 406.3333333333333, + "r_y3": 105.66666666666666, "coord_origin": "TOPLEFT" }, - "text": "cell", - "orig": "cell", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.96231712, + "confidence": 96.0, "from_ocr": true }, { @@ -846,20 +766,20 @@ "a": 255 }, "rect": { - "r_x0": 398.3333333333333, - "r_y0": 237.33333333333331, - "r_x1": 422.0, - "r_y1": 237.33333333333331, - "r_x2": 422.0, - "r_y2": 228.66666666666669, - "r_x3": 398.3333333333333, - "r_y3": 228.66666666666669, + "r_x0": 429.3333333333333, + "r_y0": 153.0, + "r_x1": 499.3333333333333, + "r_y1": 153.0, + "r_x2": 499.3333333333333, + "r_y2": 137.0, + "r_x3": 429.3333333333333, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.96670181, + "confidence": 94.0, "from_ocr": true }, { @@ -871,20 +791,20 @@ "a": 255 }, "rect": { - "r_x0": 426.0, - "r_y0": 237.33333333333331, - "r_x1": 463.0, - "r_y1": 237.33333333333331, - "r_x2": 463.0, - "r_y2": 229.0, - "r_x3": 426.0, - "r_y3": 229.0, + "r_x0": 408.3333333333333, + "r_y0": 204.33333333333334, + "r_x1": 514.0, + "r_y1": 204.33333333333334, + "r_x2": 514.0, + "r_y2": 188.33333333333331, + "r_x3": 408.3333333333333, + "r_y3": 188.33333333333331, "coord_origin": "TOPLEFT" }, - "text": "content", - "orig": "content", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.9589679700000001, + "confidence": 95.0, "from_ocr": true }, { @@ -896,20 +816,20 @@ "a": 255 }, "rect": { - "r_x0": 160.33333333333334, - "r_y0": 283.66666666666663, - "r_x1": 189.33333333333331, - "r_y1": 283.66666666666663, - "r_x2": 189.33333333333331, - "r_y2": 275.0, - "r_x3": 160.33333333333334, - "r_y3": 275.0, + "r_x0": 440.6666666666667, + "r_y0": 236.0, + "r_x1": 487.6666666666667, + "r_y1": 236.0, + "r_x2": 487.6666666666667, + "r_y2": 220.0, + "r_x3": 440.6666666666667, + "r_y3": 220.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.95674171, + "confidence": 95.0, "from_ocr": true }, { @@ -921,20 +841,20 @@ "a": 255 }, "rect": { - "r_x0": 193.0, - "r_y0": 283.66666666666663, - "r_x1": 219.0, - "r_y1": 283.66666666666663, - "r_x2": 219.0, - "r_y2": 275.0, - "r_x3": 193.0, - "r_y3": 275.0, + "r_x0": 408.3333333333333, + "r_y0": 284.0, + "r_x1": 514.0, + "r_y1": 284.0, + "r_x2": 514.0, + "r_y2": 268.0, + "r_x3": 408.3333333333333, + "r_y3": 268.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.9601168099999999, + "confidence": 95.0, "from_ocr": true }, { @@ -946,85 +866,115 @@ "a": 255 }, "rect": { - "r_x0": 222.66666666666669, - "r_y0": 283.66666666666663, - "r_x1": 240.33333333333331, - "r_y1": 283.66666666666663, - "r_x2": 240.33333333333331, - "r_y2": 277.33333333333337, - "r_x3": 222.66666666666669, - "r_y3": 277.33333333333337, + "r_x0": 440.6666666666667, + "r_y0": 315.33333333333337, + "r_x1": 487.6666666666667, + "r_y1": 315.33333333333337, + "r_x2": 487.6666666666667, + "r_y2": 299.66666666666663, + "r_x3": 440.6666666666667, + "r_y3": 299.66666666666663, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96364174, - "from_ocr": true - }, - { - "index": 16, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 283.0, - "r_y0": 283.66666666666663, - "r_x1": 309.0, - "r_y1": 283.66666666666663, - "r_x2": 309.0, - "r_y2": 275.0, - "r_x3": 283.0, - "r_y3": 275.0, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.9636872099999999, - "from_ocr": true - }, - { - "index": 17, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 312.33333333333337, - "r_y0": 283.66666666666663, - "r_x1": 336.33333333333337, - "r_y1": 283.66666666666663, - "r_x2": 336.33333333333337, - "r_y2": 275.0, - "r_x3": 312.33333333333337, - "r_y3": 275.0, - "coord_origin": "TOPLEFT" - }, - "text": "don't", - "orig": "don't", - "text_direction": "left_to_right", - "confidence": 0.9636872099999999, + "confidence": 95.0, "from_ocr": true } ], "children": [ { - "id": 4, + "id": 1, "label": "text", "bbox": { - "l": 275.33333333333337, - "t": 182.33333333333334, - "r": 343.66666666666663, - "b": 191.0, + "l": 97.33333333333333, + "t": 105.66666666666666, + "r": 190.0, + "b": 126.33333333333334, "coord_origin": "TOPLEFT" }, - "confidence": 0.9056976437568665, + "confidence": 89.0, + "cells": [ + { + "index": 0, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 97.33333333333333, + "r_y0": 126.33333333333334, + "r_x1": 190.0, + "r_y1": 126.33333333333334, + "r_x2": 190.0, + "r_y2": 105.66666666666666, + "r_x3": 97.33333333333333, + "r_y3": 105.66666666666666, + "coord_origin": "TOPLEFT" + }, + "text": "Vertically", + "orig": "Vertically", + "text_direction": "left_to_right", + "confidence": 89.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 2, + "label": "text", + "bbox": { + "l": 112.0, + "t": 137.0, + "r": 182.33333333333334, + "b": 157.66666666666669, + "coord_origin": "TOPLEFT" + }, + "confidence": 92.0, + "cells": [ + { + "index": 1, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 112.0, + "r_y0": 157.66666666666669, + "r_x1": 182.33333333333334, + "r_y1": 157.66666666666669, + "r_x2": 182.33333333333334, + "r_y2": 137.0, + "r_x3": 112.0, + "r_y3": 137.0, + "coord_origin": "TOPLEFT" + }, + "text": "merged", + "orig": "merged", + "text_direction": "left_to_right", + "confidence": 92.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 3, + "label": "text", + "bbox": { + "l": 121.66666666666667, + "t": 204.33333333333334, + "r": 168.66666666666666, + "b": 220.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, "cells": [ { "index": 2, @@ -1035,22 +985,37 @@ "a": 255 }, "rect": { - "r_x0": 275.33333333333337, - "r_y0": 191.0, - "r_x1": 304.0, - "r_y1": 191.0, - "r_x2": 304.0, - "r_y2": 182.33333333333334, - "r_x3": 275.33333333333337, - "r_y3": 182.33333333333334, + "r_x0": 121.66666666666667, + "r_y0": 220.0, + "r_x1": 168.66666666666666, + "r_y1": 220.0, + "r_x2": 168.66666666666666, + "r_y2": 204.33333333333334, + "r_x3": 121.66666666666667, + "r_y3": 204.33333333333334, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9609484899999999, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 4, + "label": "text", + "bbox": { + "l": 121.66666666666667, + "t": 284.0, + "r": 168.66666666666666, + "b": 300.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ { "index": 3, "rgba": { @@ -1060,20 +1025,20 @@ "a": 255 }, "rect": { - "r_x0": 308.0, - "r_y0": 191.0, - "r_x1": 343.66666666666663, - "r_y1": 191.0, - "r_x2": 343.66666666666663, - "r_y2": 182.33333333333334, - "r_x3": 308.0, - "r_y3": 182.33333333333334, + "r_x0": 121.66666666666667, + "r_y0": 300.0, + "r_x1": 168.66666666666666, + "r_y1": 300.0, + "r_x2": 168.66666666666666, + "r_y2": 284.0, + "r_x3": 121.66666666666667, + "r_y3": 284.0, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.95935837, + "confidence": 96.0, "from_ocr": true } ], @@ -1083,13 +1048,13 @@ "id": 5, "label": "text", "bbox": { - "l": 381.3333333333333, - "t": 182.33333333333334, - "r": 479.3333333333333, - "b": 191.0, + "l": 232.66666666666666, + "t": 105.66666666666666, + "r": 364.0, + "b": 126.33333333333334, "coord_origin": "TOPLEFT" }, - "confidence": 0.9007152318954468, + "confidence": 92.0, "cells": [ { "index": 4, @@ -1100,22 +1065,37 @@ "a": 255 }, "rect": { - "r_x0": 381.3333333333333, - "r_y0": 191.0, - "r_x1": 410.3333333333333, - "r_y1": 191.0, - "r_x2": 410.3333333333333, - "r_y2": 182.33333333333334, - "r_x3": 381.3333333333333, - "r_y3": 182.33333333333334, + "r_x0": 232.66666666666666, + "r_y0": 126.33333333333334, + "r_x1": 364.0, + "r_y1": 126.33333333333334, + "r_x2": 364.0, + "r_y2": 105.66666666666666, + "r_x3": 232.66666666666666, + "r_y3": 105.66666666666666, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 0.95280136, + "confidence": 92.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 6, + "label": "text", + "bbox": { + "l": 265.66666666666663, + "t": 137.0, + "r": 336.0, + "b": 153.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ { "index": 5, "rgba": { @@ -1125,22 +1105,37 @@ "a": 255 }, "rect": { - "r_x0": 414.3333333333333, - "r_y0": 191.0, - "r_x1": 440.3333333333333, - "r_y1": 191.0, - "r_x2": 440.3333333333333, - "r_y2": 182.33333333333334, - "r_x3": 414.3333333333333, - "r_y3": 182.33333333333334, + "r_x0": 265.66666666666663, + "r_y0": 153.0, + "r_x1": 336.0, + "r_y1": 153.0, + "r_x2": 336.0, + "r_y2": 137.0, + "r_x3": 265.66666666666663, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9649115, + "confidence": 94.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 7, + "label": "text", + "bbox": { + "l": 247.0, + "t": 188.33333333333331, + "r": 349.6666666666667, + "b": 204.33333333333334, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ { "index": 6, "rgba": { @@ -1150,36 +1145,36 @@ "a": 255 }, "rect": { - "r_x0": 443.3333333333333, - "r_y0": 191.0, - "r_x1": 479.3333333333333, - "r_y1": 191.0, - "r_x2": 479.3333333333333, - "r_y2": 182.33333333333334, - "r_x3": 443.3333333333333, - "r_y3": 182.33333333333334, + "r_x0": 247.0, + "r_y0": 204.33333333333334, + "r_x1": 349.6666666666667, + "r_y1": 204.33333333333334, + "r_x2": 349.6666666666667, + "r_y2": 188.33333333333331, + "r_x3": 247.0, + "r_y3": 188.33333333333331, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.9639427899999999, + "confidence": 94.0, "from_ocr": true } ], "children": [] }, { - "id": 1, + "id": 8, "label": "text", "bbox": { - "l": 175.0, - "t": 228.66666666666669, - "r": 225.66666666666669, - "b": 237.33333333333331, + "l": 277.0, + "t": 220.0, + "r": 324.3333333333333, + "b": 236.0, "coord_origin": "TOPLEFT" }, - "confidence": 0.9129480123519897, + "confidence": 96.0, "cells": [ { "index": 7, @@ -1190,22 +1185,37 @@ "a": 255 }, "rect": { - "r_x0": 175.0, - "r_y0": 237.33333333333331, - "r_x1": 204.0, - "r_y1": 237.33333333333331, - "r_x2": 204.0, - "r_y2": 228.66666666666669, - "r_x3": 175.0, - "r_y3": 228.66666666666669, + "r_x0": 277.0, + "r_y0": 236.0, + "r_x1": 324.3333333333333, + "r_y1": 236.0, + "r_x2": 324.3333333333333, + "r_y2": 220.0, + "r_x3": 277.0, + "r_y3": 220.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96050453, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 9, + "label": "text", + "bbox": { + "l": 247.0, + "t": 268.0, + "r": 349.6666666666667, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 92.0, + "cells": [ { "index": 8, "rgba": { @@ -1215,36 +1225,36 @@ "a": 255 }, "rect": { - "r_x0": 208.0, - "r_y0": 237.33333333333331, - "r_x1": 225.66666666666669, - "r_y1": 237.33333333333331, - "r_x2": 225.66666666666669, - "r_y2": 231.0, - "r_x3": 208.0, - "r_y3": 231.0, + "r_x0": 247.0, + "r_y0": 284.0, + "r_x1": 349.6666666666667, + "r_y1": 284.0, + "r_x2": 349.6666666666667, + "r_y2": 268.0, + "r_x3": 247.0, + "r_y3": 268.0, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.9623416899999999, + "confidence": 92.0, "from_ocr": true } ], "children": [] }, { - "id": 2, + "id": 10, "label": "text", "bbox": { - "l": 286.0, - "t": 228.66666666666669, - "r": 333.0, - "b": 237.33333333333331, + "l": 277.0, + "t": 299.66666666666663, + "r": 324.3333333333333, + "b": 315.33333333333337, "coord_origin": "TOPLEFT" }, - "confidence": 0.9123309850692749, + "confidence": 96.0, "cells": [ { "index": 9, @@ -1255,22 +1265,37 @@ "a": 255 }, "rect": { - "r_x0": 286.0, - "r_y0": 237.33333333333331, - "r_x1": 313.0, - "r_y1": 237.33333333333331, - "r_x2": 313.0, - "r_y2": 231.0, - "r_x3": 286.0, - "r_y3": 231.0, + "r_x0": 277.0, + "r_y0": 315.33333333333337, + "r_x1": 324.3333333333333, + "r_y1": 315.33333333333337, + "r_x2": 324.3333333333333, + "r_y2": 299.66666666666663, + "r_x3": 277.0, + "r_y3": 299.66666666666663, "coord_origin": "TOPLEFT" }, - "text": "some", - "orig": "some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96279846, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 11, + "label": "text", + "bbox": { + "l": 406.3333333333333, + "t": 105.66666666666666, + "r": 518.3333333333333, + "b": 121.66666666666666, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ { "index": 10, "rgba": { @@ -1280,36 +1305,36 @@ "a": 255 }, "rect": { - "r_x0": 317.0, - "r_y0": 237.33333333333331, - "r_x1": 333.0, - "r_y1": 237.33333333333331, - "r_x2": 333.0, - "r_y2": 228.66666666666669, - "r_x3": 317.0, - "r_y3": 228.66666666666669, + "r_x0": 406.3333333333333, + "r_y0": 121.66666666666666, + "r_x1": 518.3333333333333, + "r_y1": 121.66666666666666, + "r_x2": 518.3333333333333, + "r_y2": 105.66666666666666, + "r_x3": 406.3333333333333, + "r_y3": 105.66666666666666, "coord_origin": "TOPLEFT" }, - "text": "cell", - "orig": "cell", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.96231712, + "confidence": 96.0, "from_ocr": true } ], "children": [] }, { - "id": 6, + "id": 12, "label": "text", "bbox": { - "l": 398.3333333333333, - "t": 228.66666666666669, - "r": 463.0, - "b": 237.33333333333331, + "l": 429.3333333333333, + "t": 137.0, + "r": 499.3333333333333, + "b": 153.0, "coord_origin": "TOPLEFT" }, - "confidence": 0.8969476819038391, + "confidence": 94.0, "cells": [ { "index": 11, @@ -1320,22 +1345,37 @@ "a": 255 }, "rect": { - "r_x0": 398.3333333333333, - "r_y0": 237.33333333333331, - "r_x1": 422.0, - "r_y1": 237.33333333333331, - "r_x2": 422.0, - "r_y2": 228.66666666666669, - "r_x3": 398.3333333333333, - "r_y3": 228.66666666666669, + "r_x0": 429.3333333333333, + "r_y0": 153.0, + "r_x1": 499.3333333333333, + "r_y1": 153.0, + "r_x2": 499.3333333333333, + "r_y2": 137.0, + "r_x3": 429.3333333333333, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.96670181, + "confidence": 94.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 13, + "label": "text", + "bbox": { + "l": 408.3333333333333, + "t": 188.33333333333331, + "r": 514.0, + "b": 204.33333333333334, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 12, "rgba": { @@ -1345,36 +1385,36 @@ "a": 255 }, "rect": { - "r_x0": 426.0, - "r_y0": 237.33333333333331, - "r_x1": 463.0, - "r_y1": 237.33333333333331, - "r_x2": 463.0, - "r_y2": 229.0, - "r_x3": 426.0, - "r_y3": 229.0, + "r_x0": 408.3333333333333, + "r_y0": 204.33333333333334, + "r_x1": 514.0, + "r_y1": 204.33333333333334, + "r_x2": 514.0, + "r_y2": 188.33333333333331, + "r_x3": 408.3333333333333, + "r_y3": 188.33333333333331, "coord_origin": "TOPLEFT" }, - "text": "content", - "orig": "content", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.9589679700000001, + "confidence": 95.0, "from_ocr": true } ], "children": [] }, { - "id": 0, + "id": 14, "label": "text", "bbox": { - "l": 160.33333333333334, - "t": 275.0, - "r": 240.33333333333331, - "b": 283.66666666666663, + "l": 440.6666666666667, + "t": 220.0, + "r": 487.6666666666667, + "b": 236.0, "coord_origin": "TOPLEFT" }, - "confidence": 0.9129647612571716, + "confidence": 95.0, "cells": [ { "index": 13, @@ -1385,22 +1425,37 @@ "a": 255 }, "rect": { - "r_x0": 160.33333333333334, - "r_y0": 283.66666666666663, - "r_x1": 189.33333333333331, - "r_y1": 283.66666666666663, - "r_x2": 189.33333333333331, - "r_y2": 275.0, - "r_x3": 160.33333333333334, - "r_y3": 275.0, + "r_x0": 440.6666666666667, + "r_y0": 236.0, + "r_x1": 487.6666666666667, + "r_y1": 236.0, + "r_x2": 487.6666666666667, + "r_y2": 220.0, + "r_x3": 440.6666666666667, + "r_y3": 220.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.95674171, + "confidence": 95.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 15, + "label": "text", + "bbox": { + "l": 408.3333333333333, + "t": 268.0, + "r": 514.0, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 14, "rgba": { @@ -1410,22 +1465,37 @@ "a": 255 }, "rect": { - "r_x0": 193.0, - "r_y0": 283.66666666666663, - "r_x1": 219.0, - "r_y1": 283.66666666666663, - "r_x2": 219.0, - "r_y2": 275.0, - "r_x3": 193.0, - "r_y3": 275.0, + "r_x0": 408.3333333333333, + "r_y0": 284.0, + "r_x1": 514.0, + "r_y1": 284.0, + "r_x2": 514.0, + "r_y2": 268.0, + "r_x3": 408.3333333333333, + "r_y3": 268.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.9601168099999999, + "confidence": 95.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 16, + "label": "text", + "bbox": { + "l": 440.6666666666667, + "t": 299.66666666666663, + "r": 487.6666666666667, + "b": 315.33333333333337, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 15, "rgba": { @@ -1435,85 +1505,20 @@ "a": 255 }, "rect": { - "r_x0": 222.66666666666669, - "r_y0": 283.66666666666663, - "r_x1": 240.33333333333331, - "r_y1": 283.66666666666663, - "r_x2": 240.33333333333331, - "r_y2": 277.33333333333337, - "r_x3": 222.66666666666669, - "r_y3": 277.33333333333337, + "r_x0": 440.6666666666667, + "r_y0": 315.33333333333337, + "r_x1": 487.6666666666667, + "r_y1": 315.33333333333337, + "r_x2": 487.6666666666667, + "r_y2": 299.66666666666663, + "r_x3": 440.6666666666667, + "r_y3": 299.66666666666663, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96364174, - "from_ocr": true - } - ], - "children": [] - }, - { - "id": 3, - "label": "text", - "bbox": { - "l": 283.0, - "t": 275.0, - "r": 336.33333333333337, - "b": 283.66666666666663, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.9102913737297058, - "cells": [ - { - "index": 16, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 283.0, - "r_y0": 283.66666666666663, - "r_x1": 309.0, - "r_y1": 283.66666666666663, - "r_x2": 309.0, - "r_y2": 275.0, - "r_x3": 283.0, - "r_y3": 275.0, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.9636872099999999, - "from_ocr": true - }, - { - "index": 17, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 312.33333333333337, - "r_y0": 283.66666666666663, - "r_x1": 336.33333333333337, - "r_y1": 283.66666666666663, - "r_x2": 336.33333333333337, - "r_y2": 275.0, - "r_x3": 312.33333333333337, - "r_y3": 275.0, - "coord_origin": "TOPLEFT" - }, - "text": "don't", - "orig": "don't", - "text_direction": "left_to_right", - "confidence": 0.9636872099999999, + "confidence": 95.0, "from_ocr": true } ], @@ -1524,7 +1529,1259 @@ ] }, "tablestructure": { - "table_map": {} + "table_map": { + "0": { + "label": "table", + "id": 0, + "page_no": 0, + "cluster": { + "id": 0, + "label": "table", + "bbox": { + "l": 69.04969024658203, + "t": 87.64955139160156, + "r": 551.0990600585938, + "b": 334.58026123046875, + "coord_origin": "TOPLEFT" + }, + "confidence": 0.9790865778923035, + "cells": [ + { + "index": 0, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 97.33333333333333, + "r_y0": 126.33333333333334, + "r_x1": 190.0, + "r_y1": 126.33333333333334, + "r_x2": 190.0, + "r_y2": 105.66666666666666, + "r_x3": 97.33333333333333, + "r_y3": 105.66666666666666, + "coord_origin": "TOPLEFT" + }, + "text": "Vertically", + "orig": "Vertically", + "text_direction": "left_to_right", + "confidence": 89.0, + "from_ocr": true + }, + { + "index": 1, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 112.0, + "r_y0": 157.66666666666669, + "r_x1": 182.33333333333334, + "r_y1": 157.66666666666669, + "r_x2": 182.33333333333334, + "r_y2": 137.0, + "r_x3": 112.0, + "r_y3": 137.0, + "coord_origin": "TOPLEFT" + }, + "text": "merged", + "orig": "merged", + "text_direction": "left_to_right", + "confidence": 92.0, + "from_ocr": true + }, + { + "index": 2, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 121.66666666666667, + "r_y0": 220.0, + "r_x1": 168.66666666666666, + "r_y1": 220.0, + "r_x2": 168.66666666666666, + "r_y2": 204.33333333333334, + "r_x3": 121.66666666666667, + "r_y3": 204.33333333333334, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + }, + { + "index": 3, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 121.66666666666667, + "r_y0": 300.0, + "r_x1": 168.66666666666666, + "r_y1": 300.0, + "r_x2": 168.66666666666666, + "r_y2": 284.0, + "r_x3": 121.66666666666667, + "r_y3": 284.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + }, + { + "index": 4, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 232.66666666666666, + "r_y0": 126.33333333333334, + "r_x1": 364.0, + "r_y1": 126.33333333333334, + "r_x2": 364.0, + "r_y2": 105.66666666666666, + "r_x3": 232.66666666666666, + "r_y3": 105.66666666666666, + "coord_origin": "TOPLEFT" + }, + "text": "Other merged", + "orig": "Other merged", + "text_direction": "left_to_right", + "confidence": 92.0, + "from_ocr": true + }, + { + "index": 5, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 265.66666666666663, + "r_y0": 153.0, + "r_x1": 336.0, + "r_y1": 153.0, + "r_x2": 336.0, + "r_y2": 137.0, + "r_x3": 265.66666666666663, + "r_y3": 137.0, + "coord_origin": "TOPLEFT" + }, + "text": "column", + "orig": "column", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + }, + { + "index": 6, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 247.0, + "r_y0": 204.33333333333334, + "r_x1": 349.6666666666667, + "r_y1": 204.33333333333334, + "r_x2": 349.6666666666667, + "r_y2": 188.33333333333331, + "r_x3": 247.0, + "r_y3": 188.33333333333331, + "coord_origin": "TOPLEFT" + }, + "text": "Some other", + "orig": "Some other", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + }, + { + "index": 7, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 277.0, + "r_y0": 236.0, + "r_x1": 324.3333333333333, + "r_y1": 236.0, + "r_x2": 324.3333333333333, + "r_y2": 220.0, + "r_x3": 277.0, + "r_y3": 220.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + }, + { + "index": 8, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 247.0, + "r_y0": 284.0, + "r_x1": 349.6666666666667, + "r_y1": 284.0, + "r_x2": 349.6666666666667, + "r_y2": 268.0, + "r_x3": 247.0, + "r_y3": 268.0, + "coord_origin": "TOPLEFT" + }, + "text": "Some other", + "orig": "Some other", + "text_direction": "left_to_right", + "confidence": 92.0, + "from_ocr": true + }, + { + "index": 9, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 277.0, + "r_y0": 315.33333333333337, + "r_x1": 324.3333333333333, + "r_y1": 315.33333333333337, + "r_x2": 324.3333333333333, + "r_y2": 299.66666666666663, + "r_x3": 277.0, + "r_y3": 299.66666666666663, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + }, + { + "index": 10, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 406.3333333333333, + "r_y0": 121.66666666666666, + "r_x1": 518.3333333333333, + "r_y1": 121.66666666666666, + "r_x2": 518.3333333333333, + "r_y2": 105.66666666666666, + "r_x3": 406.3333333333333, + "r_y3": 105.66666666666666, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + }, + { + "index": 11, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 429.3333333333333, + "r_y0": 153.0, + "r_x1": 499.3333333333333, + "r_y1": 153.0, + "r_x2": 499.3333333333333, + "r_y2": 137.0, + "r_x3": 429.3333333333333, + "r_y3": 137.0, + "coord_origin": "TOPLEFT" + }, + "text": "column", + "orig": "column", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + }, + { + "index": 12, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 408.3333333333333, + "r_y0": 204.33333333333334, + "r_x1": 514.0, + "r_y1": 204.33333333333334, + "r_x2": 514.0, + "r_y2": 188.33333333333331, + "r_x3": 408.3333333333333, + "r_y3": 188.33333333333331, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 440.6666666666667, + "r_y0": 236.0, + "r_x1": 487.6666666666667, + "r_y1": 236.0, + "r_x2": 487.6666666666667, + "r_y2": 220.0, + "r_x3": 440.6666666666667, + "r_y3": 220.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 408.3333333333333, + "r_y0": 284.0, + "r_x1": 514.0, + "r_y1": 284.0, + "r_x2": 514.0, + "r_y2": 268.0, + "r_x3": 408.3333333333333, + "r_y3": 268.0, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 440.6666666666667, + "r_y0": 315.33333333333337, + "r_x1": 487.6666666666667, + "r_y1": 315.33333333333337, + "r_x2": 487.6666666666667, + "r_y2": 299.66666666666663, + "r_x3": 440.6666666666667, + "r_y3": 299.66666666666663, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [ + { + "id": 1, + "label": "text", + "bbox": { + "l": 97.33333333333333, + "t": 105.66666666666666, + "r": 190.0, + "b": 126.33333333333334, + "coord_origin": "TOPLEFT" + }, + "confidence": 89.0, + "cells": [ + { + "index": 0, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 97.33333333333333, + "r_y0": 126.33333333333334, + "r_x1": 190.0, + "r_y1": 126.33333333333334, + "r_x2": 190.0, + "r_y2": 105.66666666666666, + "r_x3": 97.33333333333333, + "r_y3": 105.66666666666666, + "coord_origin": "TOPLEFT" + }, + "text": "Vertically", + "orig": "Vertically", + "text_direction": "left_to_right", + "confidence": 89.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 2, + "label": "text", + "bbox": { + "l": 112.0, + "t": 137.0, + "r": 182.33333333333334, + "b": 157.66666666666669, + "coord_origin": "TOPLEFT" + }, + "confidence": 92.0, + "cells": [ + { + "index": 1, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 112.0, + "r_y0": 157.66666666666669, + "r_x1": 182.33333333333334, + "r_y1": 157.66666666666669, + "r_x2": 182.33333333333334, + "r_y2": 137.0, + "r_x3": 112.0, + "r_y3": 137.0, + "coord_origin": "TOPLEFT" + }, + "text": "merged", + "orig": "merged", + "text_direction": "left_to_right", + "confidence": 92.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 3, + "label": "text", + "bbox": { + "l": 121.66666666666667, + "t": 204.33333333333334, + "r": 168.66666666666666, + "b": 220.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ + { + "index": 2, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 121.66666666666667, + "r_y0": 220.0, + "r_x1": 168.66666666666666, + "r_y1": 220.0, + "r_x2": 168.66666666666666, + "r_y2": 204.33333333333334, + "r_x3": 121.66666666666667, + "r_y3": 204.33333333333334, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 4, + "label": "text", + "bbox": { + "l": 121.66666666666667, + "t": 284.0, + "r": 168.66666666666666, + "b": 300.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ + { + "index": 3, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 121.66666666666667, + "r_y0": 300.0, + "r_x1": 168.66666666666666, + "r_y1": 300.0, + "r_x2": 168.66666666666666, + "r_y2": 284.0, + "r_x3": 121.66666666666667, + "r_y3": 284.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 5, + "label": "text", + "bbox": { + "l": 232.66666666666666, + "t": 105.66666666666666, + "r": 364.0, + "b": 126.33333333333334, + "coord_origin": "TOPLEFT" + }, + "confidence": 92.0, + "cells": [ + { + "index": 4, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 232.66666666666666, + "r_y0": 126.33333333333334, + "r_x1": 364.0, + "r_y1": 126.33333333333334, + "r_x2": 364.0, + "r_y2": 105.66666666666666, + "r_x3": 232.66666666666666, + "r_y3": 105.66666666666666, + "coord_origin": "TOPLEFT" + }, + "text": "Other merged", + "orig": "Other merged", + "text_direction": "left_to_right", + "confidence": 92.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 6, + "label": "text", + "bbox": { + "l": 265.66666666666663, + "t": 137.0, + "r": 336.0, + "b": 153.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ + { + "index": 5, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 265.66666666666663, + "r_y0": 153.0, + "r_x1": 336.0, + "r_y1": 153.0, + "r_x2": 336.0, + "r_y2": 137.0, + "r_x3": 265.66666666666663, + "r_y3": 137.0, + "coord_origin": "TOPLEFT" + }, + "text": "column", + "orig": "column", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 7, + "label": "text", + "bbox": { + "l": 247.0, + "t": 188.33333333333331, + "r": 349.6666666666667, + "b": 204.33333333333334, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ + { + "index": 6, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 247.0, + "r_y0": 204.33333333333334, + "r_x1": 349.6666666666667, + "r_y1": 204.33333333333334, + "r_x2": 349.6666666666667, + "r_y2": 188.33333333333331, + "r_x3": 247.0, + "r_y3": 188.33333333333331, + "coord_origin": "TOPLEFT" + }, + "text": "Some other", + "orig": "Some other", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 8, + "label": "text", + "bbox": { + "l": 277.0, + "t": 220.0, + "r": 324.3333333333333, + "b": 236.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ + { + "index": 7, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 277.0, + "r_y0": 236.0, + "r_x1": 324.3333333333333, + "r_y1": 236.0, + "r_x2": 324.3333333333333, + "r_y2": 220.0, + "r_x3": 277.0, + "r_y3": 220.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 9, + "label": "text", + "bbox": { + "l": 247.0, + "t": 268.0, + "r": 349.6666666666667, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 92.0, + "cells": [ + { + "index": 8, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 247.0, + "r_y0": 284.0, + "r_x1": 349.6666666666667, + "r_y1": 284.0, + "r_x2": 349.6666666666667, + "r_y2": 268.0, + "r_x3": 247.0, + "r_y3": 268.0, + "coord_origin": "TOPLEFT" + }, + "text": "Some other", + "orig": "Some other", + "text_direction": "left_to_right", + "confidence": 92.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 10, + "label": "text", + "bbox": { + "l": 277.0, + "t": 299.66666666666663, + "r": 324.3333333333333, + "b": 315.33333333333337, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ + { + "index": 9, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 277.0, + "r_y0": 315.33333333333337, + "r_x1": 324.3333333333333, + "r_y1": 315.33333333333337, + "r_x2": 324.3333333333333, + "r_y2": 299.66666666666663, + "r_x3": 277.0, + "r_y3": 299.66666666666663, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 11, + "label": "text", + "bbox": { + "l": 406.3333333333333, + "t": 105.66666666666666, + "r": 518.3333333333333, + "b": 121.66666666666666, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ + { + "index": 10, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 406.3333333333333, + "r_y0": 121.66666666666666, + "r_x1": 518.3333333333333, + "r_y1": 121.66666666666666, + "r_x2": 518.3333333333333, + "r_y2": 105.66666666666666, + "r_x3": 406.3333333333333, + "r_y3": 105.66666666666666, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 12, + "label": "text", + "bbox": { + "l": 429.3333333333333, + "t": 137.0, + "r": 499.3333333333333, + "b": 153.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ + { + "index": 11, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 429.3333333333333, + "r_y0": 153.0, + "r_x1": 499.3333333333333, + "r_y1": 153.0, + "r_x2": 499.3333333333333, + "r_y2": 137.0, + "r_x3": 429.3333333333333, + "r_y3": 137.0, + "coord_origin": "TOPLEFT" + }, + "text": "column", + "orig": "column", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 13, + "label": "text", + "bbox": { + "l": 408.3333333333333, + "t": 188.33333333333331, + "r": 514.0, + "b": 204.33333333333334, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 12, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 408.3333333333333, + "r_y0": 204.33333333333334, + "r_x1": 514.0, + "r_y1": 204.33333333333334, + "r_x2": 514.0, + "r_y2": 188.33333333333331, + "r_x3": 408.3333333333333, + "r_y3": 188.33333333333331, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 14, + "label": "text", + "bbox": { + "l": 440.6666666666667, + "t": 220.0, + "r": 487.6666666666667, + "b": 236.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 440.6666666666667, + "r_y0": 236.0, + "r_x1": 487.6666666666667, + "r_y1": 236.0, + "r_x2": 487.6666666666667, + "r_y2": 220.0, + "r_x3": 440.6666666666667, + "r_y3": 220.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 15, + "label": "text", + "bbox": { + "l": 408.3333333333333, + "t": 268.0, + "r": 514.0, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 408.3333333333333, + "r_y0": 284.0, + "r_x1": 514.0, + "r_y1": 284.0, + "r_x2": 514.0, + "r_y2": 268.0, + "r_x3": 408.3333333333333, + "r_y3": 268.0, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 16, + "label": "text", + "bbox": { + "l": 440.6666666666667, + "t": 299.66666666666663, + "r": 487.6666666666667, + "b": 315.33333333333337, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 440.6666666666667, + "r_y0": 315.33333333333337, + "r_x1": 487.6666666666667, + "r_y1": 315.33333333333337, + "r_x2": 487.6666666666667, + "r_y2": 299.66666666666663, + "r_x3": 440.6666666666667, + "r_y3": 299.66666666666663, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + } + ] + }, + "text": null, + "otsl_seq": [ + "ched", + "ched", + "ched", + "nl", + "fcel", + "fcel", + "fcel", + "nl", + "fcel", + "fcel", + "fcel", + "nl" + ], + "num_rows": 3, + "num_cols": 3, + "table_cells": [ + { + "bbox": { + "l": 97.33333333333333, + "t": 105.66666666666666, + "r": 190.0, + "b": 126.33333333333334, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 0, + "end_col_offset_idx": 1, + "text": "Vertically merged", + "column_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 121.66666666666667, + "t": 204.33333333333334, + "r": 168.66666666666666, + "b": 220.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 0, + "end_col_offset_idx": 1, + "text": "value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 121.66666666666667, + "t": 284.0, + "r": 168.66666666666666, + "b": 300.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 2, + "end_row_offset_idx": 3, + "start_col_offset_idx": 0, + "end_col_offset_idx": 1, + "text": "value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 232.66666666666666, + "t": 105.66666666666666, + "r": 364.0, + "b": 126.33333333333334, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Other merged column", + "column_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 247.0, + "t": 188.33333333333331, + "r": 349.6666666666667, + "b": 204.33333333333334, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Some other value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 247.0, + "t": 268.0, + "r": 349.6666666666667, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 2, + "end_row_offset_idx": 3, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Some other value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 406.3333333333333, + "t": 105.66666666666666, + "r": 518.3333333333333, + "b": 121.66666666666666, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another column", + "column_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 408.3333333333333, + "t": 188.33333333333331, + "r": 514.0, + "b": 204.33333333333334, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 408.3333333333333, + "t": 268.0, + "r": 514.0, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 2, + "end_row_offset_idx": 3, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another value", + "column_header": false, + "row_header": false, + "row_section": false + } + ] + } + } }, "figures_classification": null, "equations_prediction": null, @@ -1533,20 +2790,20 @@ "assembled": { "elements": [ { - "label": "section_header", - "id": 9, + "label": "table", + "id": 0, "page_no": 0, "cluster": { - "id": 9, - "label": "section_header", + "id": 0, + "label": "table", "bbox": { - "l": 201.26343, - "t": 72.85059000000001, - "r": 417.96021, - "b": 101.89746000000002, + "l": 69.04969024658203, + "t": 87.64955139160156, + "r": 551.0990600585938, + "b": 334.58026123046875, "coord_origin": "TOPLEFT" }, - "confidence": 0.6777006387710571, + "confidence": 0.9790865778923035, "cells": [ { "index": 0, @@ -1557,43 +2814,22 @@ "a": 255 }, "rect": { - "r_x0": 201.26343, - "r_y0": 101.89746000000002, - "r_x1": 417.96021, - "r_y1": 101.89746000000002, - "r_x2": 417.96021, - "r_y2": 72.85059000000001, - "r_x3": 201.26343, - "r_y3": 72.85059000000001, + "r_x0": 97.33333333333333, + "r_y0": 126.33333333333334, + "r_x1": 190.0, + "r_y1": 126.33333333333334, + "r_x2": 190.0, + "r_y2": 105.66666666666666, + "r_x3": 97.33333333333333, + "r_y3": 105.66666666666666, "coord_origin": "TOPLEFT" }, - "text": "This is a table test ", - "orig": "This is a table test ", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - } - ], - "children": [] - }, - "text": "This is a table test" - }, - { - "label": "text", - "id": 7, - "page_no": 0, - "cluster": { - "id": 7, - "label": "text", - "bbox": { - "l": 72.0, - "t": 124.28821000000016, - "r": 376.27319, - "b": 136.57727, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.8428522944450378, - "cells": [ + "confidence": 89.0, + "from_ocr": true + }, { "index": 1, "rgba": { @@ -1603,43 +2839,22 @@ "a": 255 }, "rect": { - "r_x0": 72.0, - "r_y0": 136.57727, - "r_x1": 376.27319, - "r_y1": 136.57727, - "r_x2": 376.27319, - "r_y2": 124.28821000000016, - "r_x3": 72.0, - "r_y3": 124.28821000000016, + "r_x0": 112.0, + "r_y0": 157.66666666666669, + "r_x1": 182.33333333333334, + "r_y1": 157.66666666666669, + "r_x2": 182.33333333333334, + "r_y2": 137.0, + "r_x3": 112.0, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "The test starts with some random text and then a table image: ", - "orig": "The test starts with some random text and then a table image: ", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - } - ], - "children": [] - }, - "text": "The test starts with some random text and then a table image:" - }, - { - "label": "form", - "id": 8, - "page_no": 0, - "cluster": { - "id": 8, - "label": "form", - "bbox": { - "l": 160.33333333333334, - "t": 182.33333333333334, - "r": 479.3333333333333, - "b": 283.66666666666663, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.7274590134620667, - "cells": [ + "confidence": 92.0, + "from_ocr": true + }, { "index": 2, "rgba": { @@ -1649,20 +2864,20 @@ "a": 255 }, "rect": { - "r_x0": 275.33333333333337, - "r_y0": 191.0, - "r_x1": 304.0, - "r_y1": 191.0, - "r_x2": 304.0, - "r_y2": 182.33333333333334, - "r_x3": 275.33333333333337, - "r_y3": 182.33333333333334, + "r_x0": 121.66666666666667, + "r_y0": 220.0, + "r_x1": 168.66666666666666, + "r_y1": 220.0, + "r_x2": 168.66666666666666, + "r_y2": 204.33333333333334, + "r_x3": 121.66666666666667, + "r_y3": 204.33333333333334, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9609484899999999, + "confidence": 96.0, "from_ocr": true }, { @@ -1674,20 +2889,20 @@ "a": 255 }, "rect": { - "r_x0": 308.0, - "r_y0": 191.0, - "r_x1": 343.66666666666663, - "r_y1": 191.0, - "r_x2": 343.66666666666663, - "r_y2": 182.33333333333334, - "r_x3": 308.0, - "r_y3": 182.33333333333334, + "r_x0": 121.66666666666667, + "r_y0": 300.0, + "r_x1": 168.66666666666666, + "r_y1": 300.0, + "r_x2": 168.66666666666666, + "r_y2": 284.0, + "r_x3": 121.66666666666667, + "r_y3": 284.0, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.95935837, + "confidence": 96.0, "from_ocr": true }, { @@ -1699,20 +2914,20 @@ "a": 255 }, "rect": { - "r_x0": 381.3333333333333, - "r_y0": 191.0, - "r_x1": 410.3333333333333, - "r_y1": 191.0, - "r_x2": 410.3333333333333, - "r_y2": 182.33333333333334, - "r_x3": 381.3333333333333, - "r_y3": 182.33333333333334, + "r_x0": 232.66666666666666, + "r_y0": 126.33333333333334, + "r_x1": 364.0, + "r_y1": 126.33333333333334, + "r_x2": 364.0, + "r_y2": 105.66666666666666, + "r_x3": 232.66666666666666, + "r_y3": 105.66666666666666, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 0.95280136, + "confidence": 92.0, "from_ocr": true }, { @@ -1724,20 +2939,20 @@ "a": 255 }, "rect": { - "r_x0": 414.3333333333333, - "r_y0": 191.0, - "r_x1": 440.3333333333333, - "r_y1": 191.0, - "r_x2": 440.3333333333333, - "r_y2": 182.33333333333334, - "r_x3": 414.3333333333333, - "r_y3": 182.33333333333334, + "r_x0": 265.66666666666663, + "r_y0": 153.0, + "r_x1": 336.0, + "r_y1": 153.0, + "r_x2": 336.0, + "r_y2": 137.0, + "r_x3": 265.66666666666663, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9649115, + "confidence": 94.0, "from_ocr": true }, { @@ -1749,20 +2964,20 @@ "a": 255 }, "rect": { - "r_x0": 443.3333333333333, - "r_y0": 191.0, - "r_x1": 479.3333333333333, - "r_y1": 191.0, - "r_x2": 479.3333333333333, - "r_y2": 182.33333333333334, - "r_x3": 443.3333333333333, - "r_y3": 182.33333333333334, + "r_x0": 247.0, + "r_y0": 204.33333333333334, + "r_x1": 349.6666666666667, + "r_y1": 204.33333333333334, + "r_x2": 349.6666666666667, + "r_y2": 188.33333333333331, + "r_x3": 247.0, + "r_y3": 188.33333333333331, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.9639427899999999, + "confidence": 94.0, "from_ocr": true }, { @@ -1774,20 +2989,20 @@ "a": 255 }, "rect": { - "r_x0": 175.0, - "r_y0": 237.33333333333331, - "r_x1": 204.0, - "r_y1": 237.33333333333331, - "r_x2": 204.0, - "r_y2": 228.66666666666669, - "r_x3": 175.0, - "r_y3": 228.66666666666669, + "r_x0": 277.0, + "r_y0": 236.0, + "r_x1": 324.3333333333333, + "r_y1": 236.0, + "r_x2": 324.3333333333333, + "r_y2": 220.0, + "r_x3": 277.0, + "r_y3": 220.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96050453, + "confidence": 96.0, "from_ocr": true }, { @@ -1799,20 +3014,20 @@ "a": 255 }, "rect": { - "r_x0": 208.0, - "r_y0": 237.33333333333331, - "r_x1": 225.66666666666669, - "r_y1": 237.33333333333331, - "r_x2": 225.66666666666669, - "r_y2": 231.0, - "r_x3": 208.0, - "r_y3": 231.0, + "r_x0": 247.0, + "r_y0": 284.0, + "r_x1": 349.6666666666667, + "r_y1": 284.0, + "r_x2": 349.6666666666667, + "r_y2": 268.0, + "r_x3": 247.0, + "r_y3": 268.0, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.9623416899999999, + "confidence": 92.0, "from_ocr": true }, { @@ -1824,20 +3039,20 @@ "a": 255 }, "rect": { - "r_x0": 286.0, - "r_y0": 237.33333333333331, - "r_x1": 313.0, - "r_y1": 237.33333333333331, - "r_x2": 313.0, - "r_y2": 231.0, - "r_x3": 286.0, - "r_y3": 231.0, + "r_x0": 277.0, + "r_y0": 315.33333333333337, + "r_x1": 324.3333333333333, + "r_y1": 315.33333333333337, + "r_x2": 324.3333333333333, + "r_y2": 299.66666666666663, + "r_x3": 277.0, + "r_y3": 299.66666666666663, "coord_origin": "TOPLEFT" }, - "text": "some", - "orig": "some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96279846, + "confidence": 96.0, "from_ocr": true }, { @@ -1849,20 +3064,20 @@ "a": 255 }, "rect": { - "r_x0": 317.0, - "r_y0": 237.33333333333331, - "r_x1": 333.0, - "r_y1": 237.33333333333331, - "r_x2": 333.0, - "r_y2": 228.66666666666669, - "r_x3": 317.0, - "r_y3": 228.66666666666669, + "r_x0": 406.3333333333333, + "r_y0": 121.66666666666666, + "r_x1": 518.3333333333333, + "r_y1": 121.66666666666666, + "r_x2": 518.3333333333333, + "r_y2": 105.66666666666666, + "r_x3": 406.3333333333333, + "r_y3": 105.66666666666666, "coord_origin": "TOPLEFT" }, - "text": "cell", - "orig": "cell", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.96231712, + "confidence": 96.0, "from_ocr": true }, { @@ -1874,20 +3089,20 @@ "a": 255 }, "rect": { - "r_x0": 398.3333333333333, - "r_y0": 237.33333333333331, - "r_x1": 422.0, - "r_y1": 237.33333333333331, - "r_x2": 422.0, - "r_y2": 228.66666666666669, - "r_x3": 398.3333333333333, - "r_y3": 228.66666666666669, + "r_x0": 429.3333333333333, + "r_y0": 153.0, + "r_x1": 499.3333333333333, + "r_y1": 153.0, + "r_x2": 499.3333333333333, + "r_y2": 137.0, + "r_x3": 429.3333333333333, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.96670181, + "confidence": 94.0, "from_ocr": true }, { @@ -1899,20 +3114,20 @@ "a": 255 }, "rect": { - "r_x0": 426.0, - "r_y0": 237.33333333333331, - "r_x1": 463.0, - "r_y1": 237.33333333333331, - "r_x2": 463.0, - "r_y2": 229.0, - "r_x3": 426.0, - "r_y3": 229.0, + "r_x0": 408.3333333333333, + "r_y0": 204.33333333333334, + "r_x1": 514.0, + "r_y1": 204.33333333333334, + "r_x2": 514.0, + "r_y2": 188.33333333333331, + "r_x3": 408.3333333333333, + "r_y3": 188.33333333333331, "coord_origin": "TOPLEFT" }, - "text": "content", - "orig": "content", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.9589679700000001, + "confidence": 95.0, "from_ocr": true }, { @@ -1924,20 +3139,20 @@ "a": 255 }, "rect": { - "r_x0": 160.33333333333334, - "r_y0": 283.66666666666663, - "r_x1": 189.33333333333331, - "r_y1": 283.66666666666663, - "r_x2": 189.33333333333331, - "r_y2": 275.0, - "r_x3": 160.33333333333334, - "r_y3": 275.0, + "r_x0": 440.6666666666667, + "r_y0": 236.0, + "r_x1": 487.6666666666667, + "r_y1": 236.0, + "r_x2": 487.6666666666667, + "r_y2": 220.0, + "r_x3": 440.6666666666667, + "r_y3": 220.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.95674171, + "confidence": 95.0, "from_ocr": true }, { @@ -1949,20 +3164,20 @@ "a": 255 }, "rect": { - "r_x0": 193.0, - "r_y0": 283.66666666666663, - "r_x1": 219.0, - "r_y1": 283.66666666666663, - "r_x2": 219.0, - "r_y2": 275.0, - "r_x3": 193.0, - "r_y3": 275.0, + "r_x0": 408.3333333333333, + "r_y0": 284.0, + "r_x1": 514.0, + "r_y1": 284.0, + "r_x2": 514.0, + "r_y2": 268.0, + "r_x3": 408.3333333333333, + "r_y3": 268.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.9601168099999999, + "confidence": 95.0, "from_ocr": true }, { @@ -1974,85 +3189,115 @@ "a": 255 }, "rect": { - "r_x0": 222.66666666666669, - "r_y0": 283.66666666666663, - "r_x1": 240.33333333333331, - "r_y1": 283.66666666666663, - "r_x2": 240.33333333333331, - "r_y2": 277.33333333333337, - "r_x3": 222.66666666666669, - "r_y3": 277.33333333333337, + "r_x0": 440.6666666666667, + "r_y0": 315.33333333333337, + "r_x1": 487.6666666666667, + "r_y1": 315.33333333333337, + "r_x2": 487.6666666666667, + "r_y2": 299.66666666666663, + "r_x3": 440.6666666666667, + "r_y3": 299.66666666666663, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96364174, - "from_ocr": true - }, - { - "index": 16, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 283.0, - "r_y0": 283.66666666666663, - "r_x1": 309.0, - "r_y1": 283.66666666666663, - "r_x2": 309.0, - "r_y2": 275.0, - "r_x3": 283.0, - "r_y3": 275.0, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.9636872099999999, - "from_ocr": true - }, - { - "index": 17, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 312.33333333333337, - "r_y0": 283.66666666666663, - "r_x1": 336.33333333333337, - "r_y1": 283.66666666666663, - "r_x2": 336.33333333333337, - "r_y2": 275.0, - "r_x3": 312.33333333333337, - "r_y3": 275.0, - "coord_origin": "TOPLEFT" - }, - "text": "don't", - "orig": "don't", - "text_direction": "left_to_right", - "confidence": 0.9636872099999999, + "confidence": 95.0, "from_ocr": true } ], "children": [ { - "id": 4, + "id": 1, "label": "text", "bbox": { - "l": 275.33333333333337, - "t": 182.33333333333334, - "r": 343.66666666666663, - "b": 191.0, + "l": 97.33333333333333, + "t": 105.66666666666666, + "r": 190.0, + "b": 126.33333333333334, "coord_origin": "TOPLEFT" }, - "confidence": 0.9056976437568665, + "confidence": 89.0, + "cells": [ + { + "index": 0, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 97.33333333333333, + "r_y0": 126.33333333333334, + "r_x1": 190.0, + "r_y1": 126.33333333333334, + "r_x2": 190.0, + "r_y2": 105.66666666666666, + "r_x3": 97.33333333333333, + "r_y3": 105.66666666666666, + "coord_origin": "TOPLEFT" + }, + "text": "Vertically", + "orig": "Vertically", + "text_direction": "left_to_right", + "confidence": 89.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 2, + "label": "text", + "bbox": { + "l": 112.0, + "t": 137.0, + "r": 182.33333333333334, + "b": 157.66666666666669, + "coord_origin": "TOPLEFT" + }, + "confidence": 92.0, + "cells": [ + { + "index": 1, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 112.0, + "r_y0": 157.66666666666669, + "r_x1": 182.33333333333334, + "r_y1": 157.66666666666669, + "r_x2": 182.33333333333334, + "r_y2": 137.0, + "r_x3": 112.0, + "r_y3": 137.0, + "coord_origin": "TOPLEFT" + }, + "text": "merged", + "orig": "merged", + "text_direction": "left_to_right", + "confidence": 92.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 3, + "label": "text", + "bbox": { + "l": 121.66666666666667, + "t": 204.33333333333334, + "r": 168.66666666666666, + "b": 220.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, "cells": [ { "index": 2, @@ -2063,22 +3308,37 @@ "a": 255 }, "rect": { - "r_x0": 275.33333333333337, - "r_y0": 191.0, - "r_x1": 304.0, - "r_y1": 191.0, - "r_x2": 304.0, - "r_y2": 182.33333333333334, - "r_x3": 275.33333333333337, - "r_y3": 182.33333333333334, + "r_x0": 121.66666666666667, + "r_y0": 220.0, + "r_x1": 168.66666666666666, + "r_y1": 220.0, + "r_x2": 168.66666666666666, + "r_y2": 204.33333333333334, + "r_x3": 121.66666666666667, + "r_y3": 204.33333333333334, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9609484899999999, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 4, + "label": "text", + "bbox": { + "l": 121.66666666666667, + "t": 284.0, + "r": 168.66666666666666, + "b": 300.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ { "index": 3, "rgba": { @@ -2088,20 +3348,20 @@ "a": 255 }, "rect": { - "r_x0": 308.0, - "r_y0": 191.0, - "r_x1": 343.66666666666663, - "r_y1": 191.0, - "r_x2": 343.66666666666663, - "r_y2": 182.33333333333334, - "r_x3": 308.0, - "r_y3": 182.33333333333334, + "r_x0": 121.66666666666667, + "r_y0": 300.0, + "r_x1": 168.66666666666666, + "r_y1": 300.0, + "r_x2": 168.66666666666666, + "r_y2": 284.0, + "r_x3": 121.66666666666667, + "r_y3": 284.0, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.95935837, + "confidence": 96.0, "from_ocr": true } ], @@ -2111,13 +3371,13 @@ "id": 5, "label": "text", "bbox": { - "l": 381.3333333333333, - "t": 182.33333333333334, - "r": 479.3333333333333, - "b": 191.0, + "l": 232.66666666666666, + "t": 105.66666666666666, + "r": 364.0, + "b": 126.33333333333334, "coord_origin": "TOPLEFT" }, - "confidence": 0.9007152318954468, + "confidence": 92.0, "cells": [ { "index": 4, @@ -2128,22 +3388,37 @@ "a": 255 }, "rect": { - "r_x0": 381.3333333333333, - "r_y0": 191.0, - "r_x1": 410.3333333333333, - "r_y1": 191.0, - "r_x2": 410.3333333333333, - "r_y2": 182.33333333333334, - "r_x3": 381.3333333333333, - "r_y3": 182.33333333333334, + "r_x0": 232.66666666666666, + "r_y0": 126.33333333333334, + "r_x1": 364.0, + "r_y1": 126.33333333333334, + "r_x2": 364.0, + "r_y2": 105.66666666666666, + "r_x3": 232.66666666666666, + "r_y3": 105.66666666666666, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 0.95280136, + "confidence": 92.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 6, + "label": "text", + "bbox": { + "l": 265.66666666666663, + "t": 137.0, + "r": 336.0, + "b": 153.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ { "index": 5, "rgba": { @@ -2153,22 +3428,37 @@ "a": 255 }, "rect": { - "r_x0": 414.3333333333333, - "r_y0": 191.0, - "r_x1": 440.3333333333333, - "r_y1": 191.0, - "r_x2": 440.3333333333333, - "r_y2": 182.33333333333334, - "r_x3": 414.3333333333333, - "r_y3": 182.33333333333334, + "r_x0": 265.66666666666663, + "r_y0": 153.0, + "r_x1": 336.0, + "r_y1": 153.0, + "r_x2": 336.0, + "r_y2": 137.0, + "r_x3": 265.66666666666663, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9649115, + "confidence": 94.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 7, + "label": "text", + "bbox": { + "l": 247.0, + "t": 188.33333333333331, + "r": 349.6666666666667, + "b": 204.33333333333334, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ { "index": 6, "rgba": { @@ -2178,36 +3468,36 @@ "a": 255 }, "rect": { - "r_x0": 443.3333333333333, - "r_y0": 191.0, - "r_x1": 479.3333333333333, - "r_y1": 191.0, - "r_x2": 479.3333333333333, - "r_y2": 182.33333333333334, - "r_x3": 443.3333333333333, - "r_y3": 182.33333333333334, + "r_x0": 247.0, + "r_y0": 204.33333333333334, + "r_x1": 349.6666666666667, + "r_y1": 204.33333333333334, + "r_x2": 349.6666666666667, + "r_y2": 188.33333333333331, + "r_x3": 247.0, + "r_y3": 188.33333333333331, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.9639427899999999, + "confidence": 94.0, "from_ocr": true } ], "children": [] }, { - "id": 1, + "id": 8, "label": "text", "bbox": { - "l": 175.0, - "t": 228.66666666666669, - "r": 225.66666666666669, - "b": 237.33333333333331, + "l": 277.0, + "t": 220.0, + "r": 324.3333333333333, + "b": 236.0, "coord_origin": "TOPLEFT" }, - "confidence": 0.9129480123519897, + "confidence": 96.0, "cells": [ { "index": 7, @@ -2218,22 +3508,37 @@ "a": 255 }, "rect": { - "r_x0": 175.0, - "r_y0": 237.33333333333331, - "r_x1": 204.0, - "r_y1": 237.33333333333331, - "r_x2": 204.0, - "r_y2": 228.66666666666669, - "r_x3": 175.0, - "r_y3": 228.66666666666669, + "r_x0": 277.0, + "r_y0": 236.0, + "r_x1": 324.3333333333333, + "r_y1": 236.0, + "r_x2": 324.3333333333333, + "r_y2": 220.0, + "r_x3": 277.0, + "r_y3": 220.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96050453, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 9, + "label": "text", + "bbox": { + "l": 247.0, + "t": 268.0, + "r": 349.6666666666667, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 92.0, + "cells": [ { "index": 8, "rgba": { @@ -2243,36 +3548,36 @@ "a": 255 }, "rect": { - "r_x0": 208.0, - "r_y0": 237.33333333333331, - "r_x1": 225.66666666666669, - "r_y1": 237.33333333333331, - "r_x2": 225.66666666666669, - "r_y2": 231.0, - "r_x3": 208.0, - "r_y3": 231.0, + "r_x0": 247.0, + "r_y0": 284.0, + "r_x1": 349.6666666666667, + "r_y1": 284.0, + "r_x2": 349.6666666666667, + "r_y2": 268.0, + "r_x3": 247.0, + "r_y3": 268.0, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.9623416899999999, + "confidence": 92.0, "from_ocr": true } ], "children": [] }, { - "id": 2, + "id": 10, "label": "text", "bbox": { - "l": 286.0, - "t": 228.66666666666669, - "r": 333.0, - "b": 237.33333333333331, + "l": 277.0, + "t": 299.66666666666663, + "r": 324.3333333333333, + "b": 315.33333333333337, "coord_origin": "TOPLEFT" }, - "confidence": 0.9123309850692749, + "confidence": 96.0, "cells": [ { "index": 9, @@ -2283,22 +3588,37 @@ "a": 255 }, "rect": { - "r_x0": 286.0, - "r_y0": 237.33333333333331, - "r_x1": 313.0, - "r_y1": 237.33333333333331, - "r_x2": 313.0, - "r_y2": 231.0, - "r_x3": 286.0, - "r_y3": 231.0, + "r_x0": 277.0, + "r_y0": 315.33333333333337, + "r_x1": 324.3333333333333, + "r_y1": 315.33333333333337, + "r_x2": 324.3333333333333, + "r_y2": 299.66666666666663, + "r_x3": 277.0, + "r_y3": 299.66666666666663, "coord_origin": "TOPLEFT" }, - "text": "some", - "orig": "some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96279846, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 11, + "label": "text", + "bbox": { + "l": 406.3333333333333, + "t": 105.66666666666666, + "r": 518.3333333333333, + "b": 121.66666666666666, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ { "index": 10, "rgba": { @@ -2308,36 +3628,36 @@ "a": 255 }, "rect": { - "r_x0": 317.0, - "r_y0": 237.33333333333331, - "r_x1": 333.0, - "r_y1": 237.33333333333331, - "r_x2": 333.0, - "r_y2": 228.66666666666669, - "r_x3": 317.0, - "r_y3": 228.66666666666669, + "r_x0": 406.3333333333333, + "r_y0": 121.66666666666666, + "r_x1": 518.3333333333333, + "r_y1": 121.66666666666666, + "r_x2": 518.3333333333333, + "r_y2": 105.66666666666666, + "r_x3": 406.3333333333333, + "r_y3": 105.66666666666666, "coord_origin": "TOPLEFT" }, - "text": "cell", - "orig": "cell", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.96231712, + "confidence": 96.0, "from_ocr": true } ], "children": [] }, { - "id": 6, + "id": 12, "label": "text", "bbox": { - "l": 398.3333333333333, - "t": 228.66666666666669, - "r": 463.0, - "b": 237.33333333333331, + "l": 429.3333333333333, + "t": 137.0, + "r": 499.3333333333333, + "b": 153.0, "coord_origin": "TOPLEFT" }, - "confidence": 0.8969476819038391, + "confidence": 94.0, "cells": [ { "index": 11, @@ -2348,22 +3668,37 @@ "a": 255 }, "rect": { - "r_x0": 398.3333333333333, - "r_y0": 237.33333333333331, - "r_x1": 422.0, - "r_y1": 237.33333333333331, - "r_x2": 422.0, - "r_y2": 228.66666666666669, - "r_x3": 398.3333333333333, - "r_y3": 228.66666666666669, + "r_x0": 429.3333333333333, + "r_y0": 153.0, + "r_x1": 499.3333333333333, + "r_y1": 153.0, + "r_x2": 499.3333333333333, + "r_y2": 137.0, + "r_x3": 429.3333333333333, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.96670181, + "confidence": 94.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 13, + "label": "text", + "bbox": { + "l": 408.3333333333333, + "t": 188.33333333333331, + "r": 514.0, + "b": 204.33333333333334, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 12, "rgba": { @@ -2373,36 +3708,36 @@ "a": 255 }, "rect": { - "r_x0": 426.0, - "r_y0": 237.33333333333331, - "r_x1": 463.0, - "r_y1": 237.33333333333331, - "r_x2": 463.0, - "r_y2": 229.0, - "r_x3": 426.0, - "r_y3": 229.0, + "r_x0": 408.3333333333333, + "r_y0": 204.33333333333334, + "r_x1": 514.0, + "r_y1": 204.33333333333334, + "r_x2": 514.0, + "r_y2": 188.33333333333331, + "r_x3": 408.3333333333333, + "r_y3": 188.33333333333331, "coord_origin": "TOPLEFT" }, - "text": "content", - "orig": "content", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.9589679700000001, + "confidence": 95.0, "from_ocr": true } ], "children": [] }, { - "id": 0, + "id": 14, "label": "text", "bbox": { - "l": 160.33333333333334, - "t": 275.0, - "r": 240.33333333333331, - "b": 283.66666666666663, + "l": 440.6666666666667, + "t": 220.0, + "r": 487.6666666666667, + "b": 236.0, "coord_origin": "TOPLEFT" }, - "confidence": 0.9129647612571716, + "confidence": 95.0, "cells": [ { "index": 13, @@ -2413,22 +3748,37 @@ "a": 255 }, "rect": { - "r_x0": 160.33333333333334, - "r_y0": 283.66666666666663, - "r_x1": 189.33333333333331, - "r_y1": 283.66666666666663, - "r_x2": 189.33333333333331, - "r_y2": 275.0, - "r_x3": 160.33333333333334, - "r_y3": 275.0, + "r_x0": 440.6666666666667, + "r_y0": 236.0, + "r_x1": 487.6666666666667, + "r_y1": 236.0, + "r_x2": 487.6666666666667, + "r_y2": 220.0, + "r_x3": 440.6666666666667, + "r_y3": 220.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.95674171, + "confidence": 95.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 15, + "label": "text", + "bbox": { + "l": 408.3333333333333, + "t": 268.0, + "r": 514.0, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 14, "rgba": { @@ -2438,22 +3788,37 @@ "a": 255 }, "rect": { - "r_x0": 193.0, - "r_y0": 283.66666666666663, - "r_x1": 219.0, - "r_y1": 283.66666666666663, - "r_x2": 219.0, - "r_y2": 275.0, - "r_x3": 193.0, - "r_y3": 275.0, + "r_x0": 408.3333333333333, + "r_y0": 284.0, + "r_x1": 514.0, + "r_y1": 284.0, + "r_x2": 514.0, + "r_y2": 268.0, + "r_x3": 408.3333333333333, + "r_y3": 268.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.9601168099999999, + "confidence": 95.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 16, + "label": "text", + "bbox": { + "l": 440.6666666666667, + "t": 299.66666666666663, + "r": 487.6666666666667, + "b": 315.33333333333337, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 15, "rgba": { @@ -2463,85 +3828,20 @@ "a": 255 }, "rect": { - "r_x0": 222.66666666666669, - "r_y0": 283.66666666666663, - "r_x1": 240.33333333333331, - "r_y1": 283.66666666666663, - "r_x2": 240.33333333333331, - "r_y2": 277.33333333333337, - "r_x3": 222.66666666666669, - "r_y3": 277.33333333333337, + "r_x0": 440.6666666666667, + "r_y0": 315.33333333333337, + "r_x1": 487.6666666666667, + "r_y1": 315.33333333333337, + "r_x2": 487.6666666666667, + "r_y2": 299.66666666666663, + "r_x3": 440.6666666666667, + "r_y3": 299.66666666666663, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96364174, - "from_ocr": true - } - ], - "children": [] - }, - { - "id": 3, - "label": "text", - "bbox": { - "l": 283.0, - "t": 275.0, - "r": 336.33333333333337, - "b": 283.66666666666663, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.9102913737297058, - "cells": [ - { - "index": 16, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 283.0, - "r_y0": 283.66666666666663, - "r_x1": 309.0, - "r_y1": 283.66666666666663, - "r_x2": 309.0, - "r_y2": 275.0, - "r_x3": 283.0, - "r_y3": 275.0, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.9636872099999999, - "from_ocr": true - }, - { - "index": 17, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 312.33333333333337, - "r_y0": 283.66666666666663, - "r_x1": 336.33333333333337, - "r_y1": 283.66666666666663, - "r_x2": 336.33333333333337, - "r_y2": 275.0, - "r_x3": 312.33333333333337, - "r_y3": 275.0, - "coord_origin": "TOPLEFT" - }, - "text": "don't", - "orig": "don't", - "text_direction": "left_to_right", - "confidence": 0.9636872099999999, + "confidence": 95.0, "from_ocr": true } ], @@ -2549,25 +3849,214 @@ } ] }, - "text": null + "text": null, + "otsl_seq": [ + "ched", + "ched", + "ched", + "nl", + "fcel", + "fcel", + "fcel", + "nl", + "fcel", + "fcel", + "fcel", + "nl" + ], + "num_rows": 3, + "num_cols": 3, + "table_cells": [ + { + "bbox": { + "l": 97.33333333333333, + "t": 105.66666666666666, + "r": 190.0, + "b": 126.33333333333334, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 0, + "end_col_offset_idx": 1, + "text": "Vertically merged", + "column_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 121.66666666666667, + "t": 204.33333333333334, + "r": 168.66666666666666, + "b": 220.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 0, + "end_col_offset_idx": 1, + "text": "value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 121.66666666666667, + "t": 284.0, + "r": 168.66666666666666, + "b": 300.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 2, + "end_row_offset_idx": 3, + "start_col_offset_idx": 0, + "end_col_offset_idx": 1, + "text": "value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 232.66666666666666, + "t": 105.66666666666666, + "r": 364.0, + "b": 126.33333333333334, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Other merged column", + "column_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 247.0, + "t": 188.33333333333331, + "r": 349.6666666666667, + "b": 204.33333333333334, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Some other value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 247.0, + "t": 268.0, + "r": 349.6666666666667, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 2, + "end_row_offset_idx": 3, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Some other value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 406.3333333333333, + "t": 105.66666666666666, + "r": 518.3333333333333, + "b": 121.66666666666666, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another column", + "column_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 408.3333333333333, + "t": 188.33333333333331, + "r": 514.0, + "b": 204.33333333333334, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 408.3333333333333, + "t": 268.0, + "r": 514.0, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 2, + "end_row_offset_idx": 3, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another value", + "column_header": false, + "row_header": false, + "row_section": false + } + ] } ], "body": [ { - "label": "section_header", - "id": 9, + "label": "table", + "id": 0, "page_no": 0, "cluster": { - "id": 9, - "label": "section_header", + "id": 0, + "label": "table", "bbox": { - "l": 201.26343, - "t": 72.85059000000001, - "r": 417.96021, - "b": 101.89746000000002, + "l": 69.04969024658203, + "t": 87.64955139160156, + "r": 551.0990600585938, + "b": 334.58026123046875, "coord_origin": "TOPLEFT" }, - "confidence": 0.6777006387710571, + "confidence": 0.9790865778923035, "cells": [ { "index": 0, @@ -2578,43 +4067,22 @@ "a": 255 }, "rect": { - "r_x0": 201.26343, - "r_y0": 101.89746000000002, - "r_x1": 417.96021, - "r_y1": 101.89746000000002, - "r_x2": 417.96021, - "r_y2": 72.85059000000001, - "r_x3": 201.26343, - "r_y3": 72.85059000000001, + "r_x0": 97.33333333333333, + "r_y0": 126.33333333333334, + "r_x1": 190.0, + "r_y1": 126.33333333333334, + "r_x2": 190.0, + "r_y2": 105.66666666666666, + "r_x3": 97.33333333333333, + "r_y3": 105.66666666666666, "coord_origin": "TOPLEFT" }, - "text": "This is a table test ", - "orig": "This is a table test ", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - } - ], - "children": [] - }, - "text": "This is a table test" - }, - { - "label": "text", - "id": 7, - "page_no": 0, - "cluster": { - "id": 7, - "label": "text", - "bbox": { - "l": 72.0, - "t": 124.28821000000016, - "r": 376.27319, - "b": 136.57727, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.8428522944450378, - "cells": [ + "confidence": 89.0, + "from_ocr": true + }, { "index": 1, "rgba": { @@ -2624,43 +4092,22 @@ "a": 255 }, "rect": { - "r_x0": 72.0, - "r_y0": 136.57727, - "r_x1": 376.27319, - "r_y1": 136.57727, - "r_x2": 376.27319, - "r_y2": 124.28821000000016, - "r_x3": 72.0, - "r_y3": 124.28821000000016, + "r_x0": 112.0, + "r_y0": 157.66666666666669, + "r_x1": 182.33333333333334, + "r_y1": 157.66666666666669, + "r_x2": 182.33333333333334, + "r_y2": 137.0, + "r_x3": 112.0, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "The test starts with some random text and then a table image: ", - "orig": "The test starts with some random text and then a table image: ", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - } - ], - "children": [] - }, - "text": "The test starts with some random text and then a table image:" - }, - { - "label": "form", - "id": 8, - "page_no": 0, - "cluster": { - "id": 8, - "label": "form", - "bbox": { - "l": 160.33333333333334, - "t": 182.33333333333334, - "r": 479.3333333333333, - "b": 283.66666666666663, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.7274590134620667, - "cells": [ + "confidence": 92.0, + "from_ocr": true + }, { "index": 2, "rgba": { @@ -2670,20 +4117,20 @@ "a": 255 }, "rect": { - "r_x0": 275.33333333333337, - "r_y0": 191.0, - "r_x1": 304.0, - "r_y1": 191.0, - "r_x2": 304.0, - "r_y2": 182.33333333333334, - "r_x3": 275.33333333333337, - "r_y3": 182.33333333333334, + "r_x0": 121.66666666666667, + "r_y0": 220.0, + "r_x1": 168.66666666666666, + "r_y1": 220.0, + "r_x2": 168.66666666666666, + "r_y2": 204.33333333333334, + "r_x3": 121.66666666666667, + "r_y3": 204.33333333333334, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9609484899999999, + "confidence": 96.0, "from_ocr": true }, { @@ -2695,20 +4142,20 @@ "a": 255 }, "rect": { - "r_x0": 308.0, - "r_y0": 191.0, - "r_x1": 343.66666666666663, - "r_y1": 191.0, - "r_x2": 343.66666666666663, - "r_y2": 182.33333333333334, - "r_x3": 308.0, - "r_y3": 182.33333333333334, + "r_x0": 121.66666666666667, + "r_y0": 300.0, + "r_x1": 168.66666666666666, + "r_y1": 300.0, + "r_x2": 168.66666666666666, + "r_y2": 284.0, + "r_x3": 121.66666666666667, + "r_y3": 284.0, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.95935837, + "confidence": 96.0, "from_ocr": true }, { @@ -2720,20 +4167,20 @@ "a": 255 }, "rect": { - "r_x0": 381.3333333333333, - "r_y0": 191.0, - "r_x1": 410.3333333333333, - "r_y1": 191.0, - "r_x2": 410.3333333333333, - "r_y2": 182.33333333333334, - "r_x3": 381.3333333333333, - "r_y3": 182.33333333333334, + "r_x0": 232.66666666666666, + "r_y0": 126.33333333333334, + "r_x1": 364.0, + "r_y1": 126.33333333333334, + "r_x2": 364.0, + "r_y2": 105.66666666666666, + "r_x3": 232.66666666666666, + "r_y3": 105.66666666666666, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 0.95280136, + "confidence": 92.0, "from_ocr": true }, { @@ -2745,20 +4192,20 @@ "a": 255 }, "rect": { - "r_x0": 414.3333333333333, - "r_y0": 191.0, - "r_x1": 440.3333333333333, - "r_y1": 191.0, - "r_x2": 440.3333333333333, - "r_y2": 182.33333333333334, - "r_x3": 414.3333333333333, - "r_y3": 182.33333333333334, + "r_x0": 265.66666666666663, + "r_y0": 153.0, + "r_x1": 336.0, + "r_y1": 153.0, + "r_x2": 336.0, + "r_y2": 137.0, + "r_x3": 265.66666666666663, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9649115, + "confidence": 94.0, "from_ocr": true }, { @@ -2770,20 +4217,20 @@ "a": 255 }, "rect": { - "r_x0": 443.3333333333333, - "r_y0": 191.0, - "r_x1": 479.3333333333333, - "r_y1": 191.0, - "r_x2": 479.3333333333333, - "r_y2": 182.33333333333334, - "r_x3": 443.3333333333333, - "r_y3": 182.33333333333334, + "r_x0": 247.0, + "r_y0": 204.33333333333334, + "r_x1": 349.6666666666667, + "r_y1": 204.33333333333334, + "r_x2": 349.6666666666667, + "r_y2": 188.33333333333331, + "r_x3": 247.0, + "r_y3": 188.33333333333331, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.9639427899999999, + "confidence": 94.0, "from_ocr": true }, { @@ -2795,20 +4242,20 @@ "a": 255 }, "rect": { - "r_x0": 175.0, - "r_y0": 237.33333333333331, - "r_x1": 204.0, - "r_y1": 237.33333333333331, - "r_x2": 204.0, - "r_y2": 228.66666666666669, - "r_x3": 175.0, - "r_y3": 228.66666666666669, + "r_x0": 277.0, + "r_y0": 236.0, + "r_x1": 324.3333333333333, + "r_y1": 236.0, + "r_x2": 324.3333333333333, + "r_y2": 220.0, + "r_x3": 277.0, + "r_y3": 220.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96050453, + "confidence": 96.0, "from_ocr": true }, { @@ -2820,20 +4267,20 @@ "a": 255 }, "rect": { - "r_x0": 208.0, - "r_y0": 237.33333333333331, - "r_x1": 225.66666666666669, - "r_y1": 237.33333333333331, - "r_x2": 225.66666666666669, - "r_y2": 231.0, - "r_x3": 208.0, - "r_y3": 231.0, + "r_x0": 247.0, + "r_y0": 284.0, + "r_x1": 349.6666666666667, + "r_y1": 284.0, + "r_x2": 349.6666666666667, + "r_y2": 268.0, + "r_x3": 247.0, + "r_y3": 268.0, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.9623416899999999, + "confidence": 92.0, "from_ocr": true }, { @@ -2845,20 +4292,20 @@ "a": 255 }, "rect": { - "r_x0": 286.0, - "r_y0": 237.33333333333331, - "r_x1": 313.0, - "r_y1": 237.33333333333331, - "r_x2": 313.0, - "r_y2": 231.0, - "r_x3": 286.0, - "r_y3": 231.0, + "r_x0": 277.0, + "r_y0": 315.33333333333337, + "r_x1": 324.3333333333333, + "r_y1": 315.33333333333337, + "r_x2": 324.3333333333333, + "r_y2": 299.66666666666663, + "r_x3": 277.0, + "r_y3": 299.66666666666663, "coord_origin": "TOPLEFT" }, - "text": "some", - "orig": "some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96279846, + "confidence": 96.0, "from_ocr": true }, { @@ -2870,20 +4317,20 @@ "a": 255 }, "rect": { - "r_x0": 317.0, - "r_y0": 237.33333333333331, - "r_x1": 333.0, - "r_y1": 237.33333333333331, - "r_x2": 333.0, - "r_y2": 228.66666666666669, - "r_x3": 317.0, - "r_y3": 228.66666666666669, + "r_x0": 406.3333333333333, + "r_y0": 121.66666666666666, + "r_x1": 518.3333333333333, + "r_y1": 121.66666666666666, + "r_x2": 518.3333333333333, + "r_y2": 105.66666666666666, + "r_x3": 406.3333333333333, + "r_y3": 105.66666666666666, "coord_origin": "TOPLEFT" }, - "text": "cell", - "orig": "cell", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.96231712, + "confidence": 96.0, "from_ocr": true }, { @@ -2895,20 +4342,20 @@ "a": 255 }, "rect": { - "r_x0": 398.3333333333333, - "r_y0": 237.33333333333331, - "r_x1": 422.0, - "r_y1": 237.33333333333331, - "r_x2": 422.0, - "r_y2": 228.66666666666669, - "r_x3": 398.3333333333333, - "r_y3": 228.66666666666669, + "r_x0": 429.3333333333333, + "r_y0": 153.0, + "r_x1": 499.3333333333333, + "r_y1": 153.0, + "r_x2": 499.3333333333333, + "r_y2": 137.0, + "r_x3": 429.3333333333333, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.96670181, + "confidence": 94.0, "from_ocr": true }, { @@ -2920,20 +4367,20 @@ "a": 255 }, "rect": { - "r_x0": 426.0, - "r_y0": 237.33333333333331, - "r_x1": 463.0, - "r_y1": 237.33333333333331, - "r_x2": 463.0, - "r_y2": 229.0, - "r_x3": 426.0, - "r_y3": 229.0, + "r_x0": 408.3333333333333, + "r_y0": 204.33333333333334, + "r_x1": 514.0, + "r_y1": 204.33333333333334, + "r_x2": 514.0, + "r_y2": 188.33333333333331, + "r_x3": 408.3333333333333, + "r_y3": 188.33333333333331, "coord_origin": "TOPLEFT" }, - "text": "content", - "orig": "content", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.9589679700000001, + "confidence": 95.0, "from_ocr": true }, { @@ -2945,20 +4392,20 @@ "a": 255 }, "rect": { - "r_x0": 160.33333333333334, - "r_y0": 283.66666666666663, - "r_x1": 189.33333333333331, - "r_y1": 283.66666666666663, - "r_x2": 189.33333333333331, - "r_y2": 275.0, - "r_x3": 160.33333333333334, - "r_y3": 275.0, + "r_x0": 440.6666666666667, + "r_y0": 236.0, + "r_x1": 487.6666666666667, + "r_y1": 236.0, + "r_x2": 487.6666666666667, + "r_y2": 220.0, + "r_x3": 440.6666666666667, + "r_y3": 220.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.95674171, + "confidence": 95.0, "from_ocr": true }, { @@ -2970,20 +4417,20 @@ "a": 255 }, "rect": { - "r_x0": 193.0, - "r_y0": 283.66666666666663, - "r_x1": 219.0, - "r_y1": 283.66666666666663, - "r_x2": 219.0, - "r_y2": 275.0, - "r_x3": 193.0, - "r_y3": 275.0, + "r_x0": 408.3333333333333, + "r_y0": 284.0, + "r_x1": 514.0, + "r_y1": 284.0, + "r_x2": 514.0, + "r_y2": 268.0, + "r_x3": 408.3333333333333, + "r_y3": 268.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.9601168099999999, + "confidence": 95.0, "from_ocr": true }, { @@ -2995,85 +4442,115 @@ "a": 255 }, "rect": { - "r_x0": 222.66666666666669, - "r_y0": 283.66666666666663, - "r_x1": 240.33333333333331, - "r_y1": 283.66666666666663, - "r_x2": 240.33333333333331, - "r_y2": 277.33333333333337, - "r_x3": 222.66666666666669, - "r_y3": 277.33333333333337, + "r_x0": 440.6666666666667, + "r_y0": 315.33333333333337, + "r_x1": 487.6666666666667, + "r_y1": 315.33333333333337, + "r_x2": 487.6666666666667, + "r_y2": 299.66666666666663, + "r_x3": 440.6666666666667, + "r_y3": 299.66666666666663, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96364174, - "from_ocr": true - }, - { - "index": 16, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 283.0, - "r_y0": 283.66666666666663, - "r_x1": 309.0, - "r_y1": 283.66666666666663, - "r_x2": 309.0, - "r_y2": 275.0, - "r_x3": 283.0, - "r_y3": 275.0, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.9636872099999999, - "from_ocr": true - }, - { - "index": 17, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 312.33333333333337, - "r_y0": 283.66666666666663, - "r_x1": 336.33333333333337, - "r_y1": 283.66666666666663, - "r_x2": 336.33333333333337, - "r_y2": 275.0, - "r_x3": 312.33333333333337, - "r_y3": 275.0, - "coord_origin": "TOPLEFT" - }, - "text": "don't", - "orig": "don't", - "text_direction": "left_to_right", - "confidence": 0.9636872099999999, + "confidence": 95.0, "from_ocr": true } ], "children": [ { - "id": 4, + "id": 1, "label": "text", "bbox": { - "l": 275.33333333333337, - "t": 182.33333333333334, - "r": 343.66666666666663, - "b": 191.0, + "l": 97.33333333333333, + "t": 105.66666666666666, + "r": 190.0, + "b": 126.33333333333334, "coord_origin": "TOPLEFT" }, - "confidence": 0.9056976437568665, + "confidence": 89.0, + "cells": [ + { + "index": 0, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 97.33333333333333, + "r_y0": 126.33333333333334, + "r_x1": 190.0, + "r_y1": 126.33333333333334, + "r_x2": 190.0, + "r_y2": 105.66666666666666, + "r_x3": 97.33333333333333, + "r_y3": 105.66666666666666, + "coord_origin": "TOPLEFT" + }, + "text": "Vertically", + "orig": "Vertically", + "text_direction": "left_to_right", + "confidence": 89.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 2, + "label": "text", + "bbox": { + "l": 112.0, + "t": 137.0, + "r": 182.33333333333334, + "b": 157.66666666666669, + "coord_origin": "TOPLEFT" + }, + "confidence": 92.0, + "cells": [ + { + "index": 1, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 112.0, + "r_y0": 157.66666666666669, + "r_x1": 182.33333333333334, + "r_y1": 157.66666666666669, + "r_x2": 182.33333333333334, + "r_y2": 137.0, + "r_x3": 112.0, + "r_y3": 137.0, + "coord_origin": "TOPLEFT" + }, + "text": "merged", + "orig": "merged", + "text_direction": "left_to_right", + "confidence": 92.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 3, + "label": "text", + "bbox": { + "l": 121.66666666666667, + "t": 204.33333333333334, + "r": 168.66666666666666, + "b": 220.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, "cells": [ { "index": 2, @@ -3084,22 +4561,37 @@ "a": 255 }, "rect": { - "r_x0": 275.33333333333337, - "r_y0": 191.0, - "r_x1": 304.0, - "r_y1": 191.0, - "r_x2": 304.0, - "r_y2": 182.33333333333334, - "r_x3": 275.33333333333337, - "r_y3": 182.33333333333334, + "r_x0": 121.66666666666667, + "r_y0": 220.0, + "r_x1": 168.66666666666666, + "r_y1": 220.0, + "r_x2": 168.66666666666666, + "r_y2": 204.33333333333334, + "r_x3": 121.66666666666667, + "r_y3": 204.33333333333334, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9609484899999999, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 4, + "label": "text", + "bbox": { + "l": 121.66666666666667, + "t": 284.0, + "r": 168.66666666666666, + "b": 300.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ { "index": 3, "rgba": { @@ -3109,20 +4601,20 @@ "a": 255 }, "rect": { - "r_x0": 308.0, - "r_y0": 191.0, - "r_x1": 343.66666666666663, - "r_y1": 191.0, - "r_x2": 343.66666666666663, - "r_y2": 182.33333333333334, - "r_x3": 308.0, - "r_y3": 182.33333333333334, + "r_x0": 121.66666666666667, + "r_y0": 300.0, + "r_x1": 168.66666666666666, + "r_y1": 300.0, + "r_x2": 168.66666666666666, + "r_y2": 284.0, + "r_x3": 121.66666666666667, + "r_y3": 284.0, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.95935837, + "confidence": 96.0, "from_ocr": true } ], @@ -3132,13 +4624,13 @@ "id": 5, "label": "text", "bbox": { - "l": 381.3333333333333, - "t": 182.33333333333334, - "r": 479.3333333333333, - "b": 191.0, + "l": 232.66666666666666, + "t": 105.66666666666666, + "r": 364.0, + "b": 126.33333333333334, "coord_origin": "TOPLEFT" }, - "confidence": 0.9007152318954468, + "confidence": 92.0, "cells": [ { "index": 4, @@ -3149,22 +4641,37 @@ "a": 255 }, "rect": { - "r_x0": 381.3333333333333, - "r_y0": 191.0, - "r_x1": 410.3333333333333, - "r_y1": 191.0, - "r_x2": 410.3333333333333, - "r_y2": 182.33333333333334, - "r_x3": 381.3333333333333, - "r_y3": 182.33333333333334, + "r_x0": 232.66666666666666, + "r_y0": 126.33333333333334, + "r_x1": 364.0, + "r_y1": 126.33333333333334, + "r_x2": 364.0, + "r_y2": 105.66666666666666, + "r_x3": 232.66666666666666, + "r_y3": 105.66666666666666, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 0.95280136, + "confidence": 92.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 6, + "label": "text", + "bbox": { + "l": 265.66666666666663, + "t": 137.0, + "r": 336.0, + "b": 153.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ { "index": 5, "rgba": { @@ -3174,22 +4681,37 @@ "a": 255 }, "rect": { - "r_x0": 414.3333333333333, - "r_y0": 191.0, - "r_x1": 440.3333333333333, - "r_y1": 191.0, - "r_x2": 440.3333333333333, - "r_y2": 182.33333333333334, - "r_x3": 414.3333333333333, - "r_y3": 182.33333333333334, + "r_x0": 265.66666666666663, + "r_y0": 153.0, + "r_x1": 336.0, + "r_y1": 153.0, + "r_x2": 336.0, + "r_y2": 137.0, + "r_x3": 265.66666666666663, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9649115, + "confidence": 94.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 7, + "label": "text", + "bbox": { + "l": 247.0, + "t": 188.33333333333331, + "r": 349.6666666666667, + "b": 204.33333333333334, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ { "index": 6, "rgba": { @@ -3199,36 +4721,36 @@ "a": 255 }, "rect": { - "r_x0": 443.3333333333333, - "r_y0": 191.0, - "r_x1": 479.3333333333333, - "r_y1": 191.0, - "r_x2": 479.3333333333333, - "r_y2": 182.33333333333334, - "r_x3": 443.3333333333333, - "r_y3": 182.33333333333334, + "r_x0": 247.0, + "r_y0": 204.33333333333334, + "r_x1": 349.6666666666667, + "r_y1": 204.33333333333334, + "r_x2": 349.6666666666667, + "r_y2": 188.33333333333331, + "r_x3": 247.0, + "r_y3": 188.33333333333331, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.9639427899999999, + "confidence": 94.0, "from_ocr": true } ], "children": [] }, { - "id": 1, + "id": 8, "label": "text", "bbox": { - "l": 175.0, - "t": 228.66666666666669, - "r": 225.66666666666669, - "b": 237.33333333333331, + "l": 277.0, + "t": 220.0, + "r": 324.3333333333333, + "b": 236.0, "coord_origin": "TOPLEFT" }, - "confidence": 0.9129480123519897, + "confidence": 96.0, "cells": [ { "index": 7, @@ -3239,22 +4761,37 @@ "a": 255 }, "rect": { - "r_x0": 175.0, - "r_y0": 237.33333333333331, - "r_x1": 204.0, - "r_y1": 237.33333333333331, - "r_x2": 204.0, - "r_y2": 228.66666666666669, - "r_x3": 175.0, - "r_y3": 228.66666666666669, + "r_x0": 277.0, + "r_y0": 236.0, + "r_x1": 324.3333333333333, + "r_y1": 236.0, + "r_x2": 324.3333333333333, + "r_y2": 220.0, + "r_x3": 277.0, + "r_y3": 220.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96050453, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 9, + "label": "text", + "bbox": { + "l": 247.0, + "t": 268.0, + "r": 349.6666666666667, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 92.0, + "cells": [ { "index": 8, "rgba": { @@ -3264,36 +4801,36 @@ "a": 255 }, "rect": { - "r_x0": 208.0, - "r_y0": 237.33333333333331, - "r_x1": 225.66666666666669, - "r_y1": 237.33333333333331, - "r_x2": 225.66666666666669, - "r_y2": 231.0, - "r_x3": 208.0, - "r_y3": 231.0, + "r_x0": 247.0, + "r_y0": 284.0, + "r_x1": 349.6666666666667, + "r_y1": 284.0, + "r_x2": 349.6666666666667, + "r_y2": 268.0, + "r_x3": 247.0, + "r_y3": 268.0, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.9623416899999999, + "confidence": 92.0, "from_ocr": true } ], "children": [] }, { - "id": 2, + "id": 10, "label": "text", "bbox": { - "l": 286.0, - "t": 228.66666666666669, - "r": 333.0, - "b": 237.33333333333331, + "l": 277.0, + "t": 299.66666666666663, + "r": 324.3333333333333, + "b": 315.33333333333337, "coord_origin": "TOPLEFT" }, - "confidence": 0.9123309850692749, + "confidence": 96.0, "cells": [ { "index": 9, @@ -3304,22 +4841,37 @@ "a": 255 }, "rect": { - "r_x0": 286.0, - "r_y0": 237.33333333333331, - "r_x1": 313.0, - "r_y1": 237.33333333333331, - "r_x2": 313.0, - "r_y2": 231.0, - "r_x3": 286.0, - "r_y3": 231.0, + "r_x0": 277.0, + "r_y0": 315.33333333333337, + "r_x1": 324.3333333333333, + "r_y1": 315.33333333333337, + "r_x2": 324.3333333333333, + "r_y2": 299.66666666666663, + "r_x3": 277.0, + "r_y3": 299.66666666666663, "coord_origin": "TOPLEFT" }, - "text": "some", - "orig": "some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96279846, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 11, + "label": "text", + "bbox": { + "l": 406.3333333333333, + "t": 105.66666666666666, + "r": 518.3333333333333, + "b": 121.66666666666666, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ { "index": 10, "rgba": { @@ -3329,36 +4881,36 @@ "a": 255 }, "rect": { - "r_x0": 317.0, - "r_y0": 237.33333333333331, - "r_x1": 333.0, - "r_y1": 237.33333333333331, - "r_x2": 333.0, - "r_y2": 228.66666666666669, - "r_x3": 317.0, - "r_y3": 228.66666666666669, + "r_x0": 406.3333333333333, + "r_y0": 121.66666666666666, + "r_x1": 518.3333333333333, + "r_y1": 121.66666666666666, + "r_x2": 518.3333333333333, + "r_y2": 105.66666666666666, + "r_x3": 406.3333333333333, + "r_y3": 105.66666666666666, "coord_origin": "TOPLEFT" }, - "text": "cell", - "orig": "cell", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.96231712, + "confidence": 96.0, "from_ocr": true } ], "children": [] }, { - "id": 6, + "id": 12, "label": "text", "bbox": { - "l": 398.3333333333333, - "t": 228.66666666666669, - "r": 463.0, - "b": 237.33333333333331, + "l": 429.3333333333333, + "t": 137.0, + "r": 499.3333333333333, + "b": 153.0, "coord_origin": "TOPLEFT" }, - "confidence": 0.8969476819038391, + "confidence": 94.0, "cells": [ { "index": 11, @@ -3369,22 +4921,37 @@ "a": 255 }, "rect": { - "r_x0": 398.3333333333333, - "r_y0": 237.33333333333331, - "r_x1": 422.0, - "r_y1": 237.33333333333331, - "r_x2": 422.0, - "r_y2": 228.66666666666669, - "r_x3": 398.3333333333333, - "r_y3": 228.66666666666669, + "r_x0": 429.3333333333333, + "r_y0": 153.0, + "r_x1": 499.3333333333333, + "r_y1": 153.0, + "r_x2": 499.3333333333333, + "r_y2": 137.0, + "r_x3": 429.3333333333333, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.96670181, + "confidence": 94.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 13, + "label": "text", + "bbox": { + "l": 408.3333333333333, + "t": 188.33333333333331, + "r": 514.0, + "b": 204.33333333333334, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 12, "rgba": { @@ -3394,36 +4961,36 @@ "a": 255 }, "rect": { - "r_x0": 426.0, - "r_y0": 237.33333333333331, - "r_x1": 463.0, - "r_y1": 237.33333333333331, - "r_x2": 463.0, - "r_y2": 229.0, - "r_x3": 426.0, - "r_y3": 229.0, + "r_x0": 408.3333333333333, + "r_y0": 204.33333333333334, + "r_x1": 514.0, + "r_y1": 204.33333333333334, + "r_x2": 514.0, + "r_y2": 188.33333333333331, + "r_x3": 408.3333333333333, + "r_y3": 188.33333333333331, "coord_origin": "TOPLEFT" }, - "text": "content", - "orig": "content", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.9589679700000001, + "confidence": 95.0, "from_ocr": true } ], "children": [] }, { - "id": 0, + "id": 14, "label": "text", "bbox": { - "l": 160.33333333333334, - "t": 275.0, - "r": 240.33333333333331, - "b": 283.66666666666663, + "l": 440.6666666666667, + "t": 220.0, + "r": 487.6666666666667, + "b": 236.0, "coord_origin": "TOPLEFT" }, - "confidence": 0.9129647612571716, + "confidence": 95.0, "cells": [ { "index": 13, @@ -3434,22 +5001,37 @@ "a": 255 }, "rect": { - "r_x0": 160.33333333333334, - "r_y0": 283.66666666666663, - "r_x1": 189.33333333333331, - "r_y1": 283.66666666666663, - "r_x2": 189.33333333333331, - "r_y2": 275.0, - "r_x3": 160.33333333333334, - "r_y3": 275.0, + "r_x0": 440.6666666666667, + "r_y0": 236.0, + "r_x1": 487.6666666666667, + "r_y1": 236.0, + "r_x2": 487.6666666666667, + "r_y2": 220.0, + "r_x3": 440.6666666666667, + "r_y3": 220.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.95674171, + "confidence": 95.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 15, + "label": "text", + "bbox": { + "l": 408.3333333333333, + "t": 268.0, + "r": 514.0, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 14, "rgba": { @@ -3459,22 +5041,37 @@ "a": 255 }, "rect": { - "r_x0": 193.0, - "r_y0": 283.66666666666663, - "r_x1": 219.0, - "r_y1": 283.66666666666663, - "r_x2": 219.0, - "r_y2": 275.0, - "r_x3": 193.0, - "r_y3": 275.0, + "r_x0": 408.3333333333333, + "r_y0": 284.0, + "r_x1": 514.0, + "r_y1": 284.0, + "r_x2": 514.0, + "r_y2": 268.0, + "r_x3": 408.3333333333333, + "r_y3": 268.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.9601168099999999, + "confidence": 95.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 16, + "label": "text", + "bbox": { + "l": 440.6666666666667, + "t": 299.66666666666663, + "r": 487.6666666666667, + "b": 315.33333333333337, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 15, "rgba": { @@ -3484,85 +5081,20 @@ "a": 255 }, "rect": { - "r_x0": 222.66666666666669, - "r_y0": 283.66666666666663, - "r_x1": 240.33333333333331, - "r_y1": 283.66666666666663, - "r_x2": 240.33333333333331, - "r_y2": 277.33333333333337, - "r_x3": 222.66666666666669, - "r_y3": 277.33333333333337, + "r_x0": 440.6666666666667, + "r_y0": 315.33333333333337, + "r_x1": 487.6666666666667, + "r_y1": 315.33333333333337, + "r_x2": 487.6666666666667, + "r_y2": 299.66666666666663, + "r_x3": 440.6666666666667, + "r_y3": 299.66666666666663, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96364174, - "from_ocr": true - } - ], - "children": [] - }, - { - "id": 3, - "label": "text", - "bbox": { - "l": 283.0, - "t": 275.0, - "r": 336.33333333333337, - "b": 283.66666666666663, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.9102913737297058, - "cells": [ - { - "index": 16, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 283.0, - "r_y0": 283.66666666666663, - "r_x1": 309.0, - "r_y1": 283.66666666666663, - "r_x2": 309.0, - "r_y2": 275.0, - "r_x3": 283.0, - "r_y3": 275.0, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.9636872099999999, - "from_ocr": true - }, - { - "index": 17, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 312.33333333333337, - "r_y0": 283.66666666666663, - "r_x1": 336.33333333333337, - "r_y1": 283.66666666666663, - "r_x2": 336.33333333333337, - "r_y2": 275.0, - "r_x3": 312.33333333333337, - "r_y3": 275.0, - "coord_origin": "TOPLEFT" - }, - "text": "don't", - "orig": "don't", - "text_direction": "left_to_right", - "confidence": 0.9636872099999999, + "confidence": 95.0, "from_ocr": true } ], @@ -3570,7 +5102,196 @@ } ] }, - "text": null + "text": null, + "otsl_seq": [ + "ched", + "ched", + "ched", + "nl", + "fcel", + "fcel", + "fcel", + "nl", + "fcel", + "fcel", + "fcel", + "nl" + ], + "num_rows": 3, + "num_cols": 3, + "table_cells": [ + { + "bbox": { + "l": 97.33333333333333, + "t": 105.66666666666666, + "r": 190.0, + "b": 126.33333333333334, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 0, + "end_col_offset_idx": 1, + "text": "Vertically merged", + "column_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 121.66666666666667, + "t": 204.33333333333334, + "r": 168.66666666666666, + "b": 220.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 0, + "end_col_offset_idx": 1, + "text": "value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 121.66666666666667, + "t": 284.0, + "r": 168.66666666666666, + "b": 300.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 2, + "end_row_offset_idx": 3, + "start_col_offset_idx": 0, + "end_col_offset_idx": 1, + "text": "value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 232.66666666666666, + "t": 105.66666666666666, + "r": 364.0, + "b": 126.33333333333334, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Other merged column", + "column_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 247.0, + "t": 188.33333333333331, + "r": 349.6666666666667, + "b": 204.33333333333334, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Some other value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 247.0, + "t": 268.0, + "r": 349.6666666666667, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 2, + "end_row_offset_idx": 3, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Some other value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 406.3333333333333, + "t": 105.66666666666666, + "r": 518.3333333333333, + "b": 121.66666666666666, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another column", + "column_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 408.3333333333333, + "t": 188.33333333333331, + "r": 514.0, + "b": 204.33333333333334, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 408.3333333333333, + "t": 268.0, + "r": 514.0, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 2, + "end_row_offset_idx": 3, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another value", + "column_header": false, + "row_header": false, + "row_section": false + } + ] } ], "headers": [] diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_180.doctags.txt b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_180.doctags.txt index 0424fbee..4de7af73 100644 --- a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_180.doctags.txt +++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_180.doctags.txt @@ -1,9 +1,8 @@ - -insidenothingand last row 2 -haveotherand row 1 -andhave contentsome cellsthis is row 0 -Column 2Column 1Column 0 + +Vertically mergedOther merged columnYet another column +valueSome other valueYet another value +valueSome other valueYet another value
\ No newline at end of file diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_180.json b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_180.json index 07e64090..b02a5df9 100644 --- a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_180.json +++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_180.json @@ -27,13 +27,13 @@ "file-info": { "filename": "ocr_test_rotated_180.pdf", "filename-prov": null, - "document-hash": "687553cff95da8e2898fa50a68986ee2a3735ba5d287615e03c0d40fd3b33758", + "document-hash": "361fa0fc8db9c3a973d316d08509ac78cc0e7f81dea94358319092640d439ca0", "#-pages": 1, "collection-name": null, "description": null, "page-hashes": [ { - "hash": "9e7213c0aa5ff85dfdb9a5b7566dfd229a4c5b8a4e289dd68655ddb1197c3b1f", + "hash": "ab89ee70d4aee0b8dc5ed72ad42e16e98a8ec9c2eea1e03d99b50c25bbc5a806", "model": "default", "page": 1 } @@ -44,52 +44,6 @@ "name": "Table", "type": "table", "$ref": "#/tables/0" - }, - { - "prov": [ - { - "bbox": [ - 238.78076, - 124.28821000000005, - 540.0, - 136.57727 - ], - "page": 1, - "span": [ - 0, - 71 - ], - "__ref_s3_data": null - } - ], - "text": "ehT t se t w strats it modnar emos h t xe t dna t a neh t elba i egam :", - "type": "paragraph", - "payload": null, - "name": "Text", - "font": null - }, - { - "prov": [ - { - "bbox": [ - 194.03979, - 72.85058600000002, - 410.73657, - 101.89746000000002 - ], - "page": 1, - "span": [ - 0, - 20 - ], - "__ref_s3_data": null - } - ], - "text": "tset elbat a si sihT", - "type": "paragraph", - "payload": null, - "name": "Text", - "font": null } ], "figures": [], @@ -98,10 +52,10 @@ "prov": [ { "bbox": [ - 112.69406127929688, - 163.70050048828125, - 470.0718078613281, - 302.27655029296875 + 240.90093994140625, + 87.64955139160156, + 722.950309753418, + 334.58026123046875 ], "page": 1, "span": [ @@ -119,22 +73,39 @@ "data": [ [ { - "bbox": null, + "bbox": [ + 97.33333333333337, + 105.66666666666669, + 190.0, + 126.33333333333337 + ], "spans": [ [ 0, 0 ] ], - "text": "", - "type": "body" + "text": "Vertically merged", + "type": "col_header", + "col": 0, + "col-header": true, + "col-span": [ + 0, + 1 + ], + "row": 0, + "row-header": false, + "row-span": [ + 0, + 1 + ] }, { "bbox": [ - 303.0, - 508.3333333333333, - 329.0, - 517.0 + 232.33333333333326, + 105.66666666666669, + 363.6666666666667, + 126.33333333333337 ], "spans": [ [ @@ -142,7 +113,7 @@ 1 ] ], - "text": "other don't", + "text": "Other merged column", "type": "col_header", "col": 1, "col-header": true, @@ -159,10 +130,10 @@ }, { "bbox": [ - 422.6666666666667, - 508.3333333333333, - 451.6666666666667, - 517.0 + 406.3333333333333, + 105.66666666666669, + 518.0, + 121.66666666666663 ], "spans": [ [ @@ -170,7 +141,7 @@ 2 ] ], - "text": "Some other row", + "text": "Yet another column", "type": "col_header", "col": 2, "col-header": true, @@ -189,10 +160,10 @@ [ { "bbox": [ - 190.0, - 554.6666666666666, - 213.66666666666666, - 563.3333333333334 + 121.66666666666663, + 204.0, + 168.66666666666663, + 220.0 ], "spans": [ [ @@ -200,8 +171,8 @@ 0 ] ], - "text": "have content", - "type": "row_header", + "text": "value", + "type": "body", "col": 0, "col-header": false, "col-span": [ @@ -209,7 +180,7 @@ 1 ], "row": 1, - "row-header": true, + "row-header": false, "row-span": [ 1, 2 @@ -217,10 +188,10 @@ }, { "bbox": [ - 299.0, - 554.6666666666666, - 326.33333333333337, - 561.0 + 247.0, + 188.0, + 349.6666666666667, + 204.0 ], "spans": [ [ @@ -228,7 +199,7 @@ 1 ] ], - "text": "some cell", + "text": "Some other value", "type": "body", "col": 1, "col-header": false, @@ -246,9 +217,9 @@ { "bbox": [ 408.3333333333333, - 554.6666666666666, - 437.3333333333333, - 563.3333333333334 + 188.0, + 514.0, + 204.0 ], "spans": [ [ @@ -256,7 +227,7 @@ 2 ] ], - "text": "Some row", + "text": "Yet another value", "type": "body", "col": 2, "col-header": false, @@ -275,10 +246,10 @@ [ { "bbox": [ - 201.66666666666669, - 601.0, - 230.66666666666666, - 609.6666666666666 + 121.66666666666663, + 284.0, + 168.66666666666663, + 300.0 ], "spans": [ [ @@ -286,8 +257,8 @@ 0 ] ], - "text": "Some other column", - "type": "row_header", + "text": "value", + "type": "body", "col": 0, "col-header": false, "col-span": [ @@ -295,7 +266,7 @@ 1 ], "row": 2, - "row-header": true, + "row-header": false, "row-span": [ 2, 3 @@ -303,10 +274,10 @@ }, { "bbox": [ - 308.0, - 601.0, - 337.0, - 609.6666666666666 + 247.0, + 268.0, + 349.6666666666667, + 284.0 ], "spans": [ [ @@ -314,7 +285,7 @@ 1 ] ], - "text": "Some column", + "text": "Some other value", "type": "body", "col": 1, "col-header": false, @@ -330,15 +301,32 @@ ] }, { - "bbox": null, + "bbox": [ + 408.3333333333333, + 268.0, + 514.0, + 284.0 + ], "spans": [ [ 2, 2 ] ], - "text": "", - "type": "body" + "text": "Yet another value", + "type": "body", + "col": 2, + "col-header": false, + "col-span": [ + 2, + 3 + ], + "row": 2, + "row-header": false, + "row-span": [ + 2, + 3 + ] } ] ], @@ -351,9 +339,9 @@ "footnotes": [], "page-dimensions": [ { - "height": 792.0, + "height": 612.0, "page": 1, - "width": 612.0 + "width": 792.0 } ], "page-footers": [], diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_180.md b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_180.md index 8521b3f9..e3d7c0b8 100644 --- a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_180.md +++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_180.md @@ -1,5 +1,4 @@ -| inside | | nothing | and last row 2 | -|----------|--------------|------------|------------------| -| have | other | | and row 1 | -| and | have content | some cells | this is row 0 | -| Column 2 | Column 1 | Column 0 | | \ No newline at end of file +| Vertically merged | Other merged column | Yet another column | +|---------------------|-----------------------|----------------------| +| value | Some other value | Yet another value | +| value | Some other value | Yet another value | \ No newline at end of file diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_180.pages.json b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_180.pages.json index c8d38184..de743661 100644 --- a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_180.pages.json +++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_180.pages.json @@ -2,8 +2,8 @@ { "page_no": 0, "size": { - "width": 612.0, - "height": 792.0 + "width": 792.0, + "height": 612.0 }, "parsed_page": { "dimension": { @@ -11,47 +11,47 @@ "rect": { "r_x0": 0.0, "r_y0": 0.0, - "r_x1": 612.0, + "r_x1": 792.0, "r_y1": 0.0, - "r_x2": 612.0, - "r_y2": 792.0, + "r_x2": 792.0, + "r_y2": 612.0, "r_x3": 0.0, - "r_y3": 792.0, + "r_y3": 612.0, "coord_origin": "BOTTOMLEFT" }, "boundary_type": "crop_box", "art_bbox": { "l": 0.0, - "t": 792.0, - "r": 612.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" }, "bleed_bbox": { "l": 0.0, - "t": 792.0, - "r": 612.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" }, "crop_bbox": { "l": 0.0, - "t": 792.0, - "r": 612.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" }, "media_bbox": { "l": 0.0, - "t": 792.0, - "r": 612.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" }, "trim_bbox": { "l": 0.0, - "t": 792.0, - "r": 612.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" } @@ -69,21 +69,21 @@ "a": 255 }, "rect": { - "r_x0": 194.03979, - "r_y0": 719.149414, - "r_x1": 410.73657, - "r_y1": 719.149414, - "r_x2": 410.73657, - "r_y2": 690.10254, - "r_x3": 194.03979, - "r_y3": 690.10254, + "r_x0": 694.6666666666666, + "r_y0": 485.66666666666663, + "r_x1": 602.0, + "r_y1": 485.66666666666663, + "r_x2": 602.0, + "r_y2": 506.3333333333333, + "r_x3": 694.6666666666666, + "r_y3": 506.3333333333333, "coord_origin": "TOPLEFT" }, - "text": " tset elbat a si sihT", - "orig": " tset elbat a si sihT", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true }, { "index": 1, @@ -94,21 +94,21 @@ "a": 255 }, "rect": { - "r_x0": 521.0545, - "r_y0": 667.71179, - "r_x1": 540.0, - "r_y1": 667.71179, - "r_x2": 540.0, - "r_y2": 655.42273, - "r_x3": 521.0545, - "r_y3": 655.42273, + "r_x0": 680.0, + "r_y0": 454.33333333333337, + "r_x1": 610.0, + "r_y1": 454.33333333333337, + "r_x2": 610.0, + "r_y2": 475.0, + "r_x3": 680.0, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "ehT", - "orig": "ehT", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true }, { "index": 2, @@ -119,21 +119,21 @@ "a": 255 }, "rect": { - "r_x0": 518.00269, - "r_y0": 667.71179, - "r_x1": 518.00488, - "r_y1": 667.71179, - "r_x2": 518.00488, - "r_y2": 655.42273, - "r_x3": 518.00269, - "r_y3": 655.42273, + "r_x0": 670.3333333333334, + "r_y0": 392.0, + "r_x1": 623.3333333333334, + "r_y1": 392.0, + "r_x2": 623.3333333333334, + "r_y2": 408.0, + "r_x3": 670.3333333333334, + "r_y3": 408.0, "coord_origin": "TOPLEFT" }, - "text": " t", - "orig": " t", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 3, @@ -144,21 +144,21 @@ "a": 255 }, "rect": { - "r_x0": 503.33759000000003, - "r_y0": 667.71179, - "r_x1": 514.95093, - "r_y1": 667.71179, - "r_x2": 514.95093, - "r_y2": 655.42273, - "r_x3": 503.33759000000003, - "r_y3": 655.42273, + "r_x0": 670.3333333333334, + "r_y0": 312.0, + "r_x1": 623.3333333333334, + "r_y1": 312.0, + "r_x2": 623.3333333333334, + "r_y2": 328.0, + "r_x3": 670.3333333333334, + "r_y3": 328.0, "coord_origin": "TOPLEFT" }, - "text": "se", - "orig": "se", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 4, @@ -169,21 +169,21 @@ "a": 255 }, "rect": { - "r_x0": 500.28534, - "r_y0": 667.71179, - "r_x1": 500.28751, - "r_y1": 667.71179, - "r_x2": 500.28751, - "r_y2": 655.42273, - "r_x3": 500.28534, - "r_y3": 655.42273, + "r_x0": 559.6666666666667, + "r_y0": 485.66666666666663, + "r_x1": 428.3333333333333, + "r_y1": 485.66666666666663, + "r_x2": 428.3333333333333, + "r_y2": 506.3333333333333, + "r_x3": 559.6666666666667, + "r_y3": 506.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "t ", - "orig": "t ", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 5, @@ -194,21 +194,21 @@ "a": 255 }, "rect": { - "r_x0": 459.36172000000005, - "r_y0": 667.71179, - "r_x1": 497.23352, - "r_y1": 667.71179, - "r_x2": 497.23352, - "r_y2": 655.42273, - "r_x3": 459.36172000000005, - "r_y3": 655.42273, + "r_x0": 526.6666666666667, + "r_y0": 459.0, + "r_x1": 456.0, + "r_y1": 459.0, + "r_x2": 456.0, + "r_y2": 475.0, + "r_x3": 526.6666666666667, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "w strats", - "orig": "w strats", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 6, @@ -219,21 +219,21 @@ "a": 255 }, "rect": { - "r_x0": 456.92352, - "r_y0": 667.71179, - "r_x1": 456.92526, - "r_y1": 667.71179, - "r_x2": 456.92526, - "r_y2": 655.42273, - "r_x3": 456.92352, - "r_y3": 655.42273, + "r_x0": 545.0, + "r_y0": 408.0, + "r_x1": 442.3333333333333, + "r_y1": 408.0, + "r_x2": 442.3333333333333, + "r_y2": 424.0, + "r_x3": 545.0, + "r_y3": 424.0, "coord_origin": "TOPLEFT" }, - "text": "it", - "orig": "it", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 91.0, + "from_ocr": true }, { "index": 7, @@ -244,21 +244,21 @@ "a": 255 }, "rect": { - "r_x0": 377.49374, - "r_y0": 667.71179, - "r_x1": 453.87128, - "r_y1": 667.71179, - "r_x2": 453.87128, - "r_y2": 655.42273, - "r_x3": 377.49374, - "r_y3": 655.42273, + "r_x0": 515.0, + "r_y0": 376.0, + "r_x1": 468.0, + "r_y1": 376.0, + "r_x2": 468.0, + "r_y2": 392.0, + "r_x3": 515.0, + "r_y3": 392.0, "coord_origin": "TOPLEFT" }, - "text": "modnar emos h", - "orig": "modnar emos h", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 8, @@ -269,21 +269,21 @@ "a": 255 }, "rect": { - "r_x0": 374.44409, - "r_y0": 667.71179, - "r_x1": 374.44629, - "r_y1": 667.71179, - "r_x2": 374.44629, - "r_y2": 655.42273, - "r_x3": 374.44409, - "r_y3": 655.42273, + "r_x0": 545.0, + "r_y0": 328.0, + "r_x1": 442.3333333333333, + "r_y1": 328.0, + "r_x2": 442.3333333333333, + "r_y2": 344.0, + "r_x3": 545.0, + "r_y3": 344.0, "coord_origin": "TOPLEFT" }, - "text": " t", - "orig": " t", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 9, @@ -294,21 +294,21 @@ "a": 255 }, "rect": { - "r_x0": 359.77896, - "r_y0": 667.71179, - "r_x1": 371.3923, - "r_y1": 667.71179, - "r_x2": 371.3923, - "r_y2": 655.42273, - "r_x3": 359.77896, - "r_y3": 655.42273, + "r_x0": 515.0, + "r_y0": 296.6666666666667, + "r_x1": 468.0, + "r_y1": 296.6666666666667, + "r_x2": 468.0, + "r_y2": 312.6666666666667, + "r_x3": 515.0, + "r_y3": 312.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "xe", - "orig": "xe", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 10, @@ -319,21 +319,21 @@ "a": 255 }, "rect": { - "r_x0": 356.72672, - "r_y0": 667.71179, - "r_x1": 356.72888, - "r_y1": 667.71179, - "r_x2": 356.72888, - "r_y2": 655.42273, - "r_x3": 356.72672, - "r_y3": 655.42273, + "r_x0": 385.6666666666667, + "r_y0": 490.33333333333337, + "r_x1": 274.0, + "r_y1": 490.33333333333337, + "r_x2": 274.0, + "r_y2": 506.3333333333333, + "r_x3": 385.6666666666667, + "r_y3": 506.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "t ", - "orig": "t ", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 11, @@ -344,21 +344,21 @@ "a": 255 }, "rect": { - "r_x0": 335.3306, - "r_y0": 667.71179, - "r_x1": 353.67493, - "r_y1": 667.71179, - "r_x2": 353.67493, - "r_y2": 655.42273, - "r_x3": 335.3306, - "r_y3": 655.42273, + "r_x0": 363.0, + "r_y0": 459.0, + "r_x1": 292.66666666666663, + "r_y1": 459.0, + "r_x2": 292.66666666666663, + "r_y2": 475.0, + "r_x3": 363.0, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "dna", - "orig": "dna", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 12, @@ -369,21 +369,21 @@ "a": 255 }, "rect": { - "r_x0": 332.27878, - "r_y0": 667.71179, - "r_x1": 332.28094, - "r_y1": 667.71179, - "r_x2": 332.28094, - "r_y2": 655.42273, - "r_x3": 332.27878, - "r_y3": 655.42273, + "r_x0": 383.6666666666667, + "r_y0": 408.0, + "r_x1": 278.0, + "r_y1": 408.0, + "r_x2": 278.0, + "r_y2": 424.0, + "r_x3": 383.6666666666667, + "r_y3": 424.0, "coord_origin": "TOPLEFT" }, - "text": " t", - "orig": " t", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 13, @@ -394,21 +394,21 @@ "a": 255 }, "rect": { - "r_x0": 301.7153, - "r_y0": 667.71179, - "r_x1": 329.22699, - "r_y1": 667.71179, - "r_x2": 329.22699, - "r_y2": 655.42273, - "r_x3": 301.7153, - "r_y3": 655.42273, + "r_x0": 351.33333333333337, + "r_y0": 376.0, + "r_x1": 304.33333333333337, + "r_y1": 376.0, + "r_x2": 304.33333333333337, + "r_y2": 392.0, + "r_x3": 351.33333333333337, + "r_y3": 392.0, "coord_origin": "TOPLEFT" }, - "text": "a neh", - "orig": "a neh", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 14, @@ -419,21 +419,21 @@ "a": 255 }, "rect": { - "r_x0": 298.66348, - "r_y0": 667.71179, - "r_x1": 298.66565, - "r_y1": 667.71179, - "r_x2": 298.66565, - "r_y2": 655.42273, - "r_x3": 298.66348, - "r_y3": 655.42273, + "r_x0": 383.6666666666667, + "r_y0": 328.0, + "r_x1": 278.0, + "r_y1": 328.0, + "r_x2": 278.0, + "r_y2": 344.0, + "r_x3": 383.6666666666667, + "r_y3": 344.0, "coord_origin": "TOPLEFT" }, - "text": " t", - "orig": " t", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 15, @@ -444,495 +444,20 @@ "a": 255 }, "rect": { - "r_x0": 274.82526, - "r_y0": 667.71179, - "r_x1": 295.61169, - "r_y1": 667.71179, - "r_x2": 295.61169, - "r_y2": 655.42273, - "r_x3": 274.82526, - "r_y3": 655.42273, + "r_x0": 351.33333333333337, + "r_y0": 296.6666666666667, + "r_x1": 304.33333333333337, + "r_y1": 296.6666666666667, + "r_x2": 304.33333333333337, + "r_y2": 312.6666666666667, + "r_x3": 351.33333333333337, + "r_y3": 312.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "elba", - "orig": "elba", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - }, - { - "index": 16, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 271.77344, - "r_y0": 667.71179, - "r_x1": 271.7756, - "r_y1": 667.71179, - "r_x2": 271.7756, - "r_y2": 655.42273, - "r_x3": 271.77344, - "r_y3": 655.42273, - "coord_origin": "TOPLEFT" - }, - "text": " i", - "orig": " i", - "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - }, - { - "index": 17, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 241.83258, - "r_y0": 667.71179, - "r_x1": 269.3335, - "r_y1": 667.71179, - "r_x2": 269.3335, - "r_y2": 655.42273, - "r_x3": 241.83258, - "r_y3": 655.42273, - "coord_origin": "TOPLEFT" - }, - "text": "egam", - "orig": "egam", - "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - }, - { - "index": 18, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 238.78076, - "r_y0": 667.71179, - "r_x1": 238.78296, - "r_y1": 667.71179, - "r_x2": 238.78296, - "r_y2": 655.42273, - "r_x3": 238.78076, - "r_y3": 655.42273, - "coord_origin": "TOPLEFT" - }, - "text": ": ", - "orig": ": ", - "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - }, - { - "index": 19, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 337.0, - "r_y0": 601.0, - "r_x1": 308.0, - "r_y1": 601.0, - "r_x2": 308.0, - "r_y2": 609.6666666666666, - "r_x3": 337.0, - "r_y3": 609.6666666666666, - "coord_origin": "TOPLEFT" - }, - "text": "Some", - "orig": "Some", - "text_direction": "left_to_right", - "confidence": 0.95841644, - "from_ocr": true - }, - { - "index": 20, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 304.0, - "r_y0": 601.0, - "r_x1": 268.33333333333337, - "r_y1": 601.0, - "r_x2": 268.33333333333337, - "r_y2": 609.3333333333334, - "r_x3": 304.0, - "r_y3": 609.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "column", - "orig": "column", - "text_direction": "left_to_right", - "confidence": 0.95624527, - "from_ocr": true - }, - { - "index": 21, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 230.66666666666666, - "r_y0": 601.0, - "r_x1": 201.66666666666669, - "r_y1": 601.0, - "r_x2": 201.66666666666669, - "r_y2": 609.6666666666666, - "r_x3": 230.66666666666666, - "r_y3": 609.6666666666666, - "coord_origin": "TOPLEFT" - }, - "text": "Some", - "orig": "Some", - "text_direction": "left_to_right", - "confidence": 0.96296555, - "from_ocr": true - }, - { - "index": 22, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 197.66666666666669, - "r_y0": 601.0, - "r_x1": 172.0, - "r_y1": 601.0, - "r_x2": 172.0, - "r_y2": 609.3333333333334, - "r_x3": 197.66666666666669, - "r_y3": 609.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.96467484, - "from_ocr": true - }, - { - "index": 23, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 168.66666666666669, - "r_y0": 601.0, - "r_x1": 133.0, - "r_y1": 601.0, - "r_x2": 133.0, - "r_y2": 609.3333333333334, - "r_x3": 168.66666666666669, - "r_y3": 609.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "column", - "orig": "column", - "text_direction": "left_to_right", - "confidence": 0.95497986, - "from_ocr": true - }, - { - "index": 24, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 437.3333333333333, - "r_y0": 554.6666666666666, - "r_x1": 408.3333333333333, - "r_y1": 554.6666666666666, - "r_x2": 408.3333333333333, - "r_y2": 563.3333333333334, - "r_x3": 437.3333333333333, - "r_y3": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "Some", - "orig": "Some", - "text_direction": "left_to_right", - "confidence": 0.95944489, - "from_ocr": true - }, - { - "index": 25, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 404.0, - "r_y0": 554.6666666666666, - "r_x1": 386.3333333333333, - "r_y1": 554.6666666666666, - "r_x2": 386.3333333333333, - "r_y2": 561.0, - "r_x3": 404.0, - "r_y3": 561.0, - "coord_origin": "TOPLEFT" - }, - "text": "row", - "orig": "row", - "text_direction": "left_to_right", - "confidence": 0.9680950199999999, - "from_ocr": true - }, - { - "index": 26, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 326.33333333333337, - "r_y0": 554.6666666666666, - "r_x1": 299.0, - "r_y1": 554.6666666666666, - "r_x2": 299.0, - "r_y2": 561.0, - "r_x3": 326.33333333333337, - "r_y3": 561.0, - "coord_origin": "TOPLEFT" - }, - "text": "some", - "orig": "some", - "text_direction": "left_to_right", - "confidence": 0.9569136, - "from_ocr": true - }, - { - "index": 27, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 295.33333333333337, - "r_y0": 554.6666666666666, - "r_x1": 279.0, - "r_y1": 554.6666666666666, - "r_x2": 279.0, - "r_y2": 563.3333333333334, - "r_x3": 295.33333333333337, - "r_y3": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "cell", - "orig": "cell", - "text_direction": "left_to_right", - "confidence": 0.9622145799999999, - "from_ocr": true - }, - { - "index": 28, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 213.66666666666666, - "r_y0": 554.6666666666666, - "r_x1": 190.0, - "r_y1": 554.6666666666666, - "r_x2": 190.0, - "r_y2": 563.3333333333334, - "r_x3": 213.66666666666666, - "r_y3": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "have", - "orig": "have", - "text_direction": "left_to_right", - "confidence": 0.96403, - "from_ocr": true - }, - { - "index": 29, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 186.0, - "r_y0": 554.6666666666666, - "r_x1": 149.0, - "r_y1": 554.6666666666666, - "r_x2": 149.0, - "r_y2": 563.0, - "r_x3": 186.0, - "r_y3": 563.0, - "coord_origin": "TOPLEFT" - }, - "text": "content", - "orig": "content", - "text_direction": "left_to_right", - "confidence": 0.96691612, - "from_ocr": true - }, - { - "index": 30, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 451.6666666666667, - "r_y0": 508.3333333333333, - "r_x1": 422.6666666666667, - "r_y1": 508.3333333333333, - "r_x2": 422.6666666666667, - "r_y2": 517.0, - "r_x3": 451.6666666666667, - "r_y3": 517.0, - "coord_origin": "TOPLEFT" - }, - "text": "Some", - "orig": "Some", - "text_direction": "left_to_right", - "confidence": 0.9684503200000001, - "from_ocr": true - }, - { - "index": 31, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 419.0, - "r_y0": 508.3333333333333, - "r_x1": 393.0, - "r_y1": 508.3333333333333, - "r_x2": 393.0, - "r_y2": 516.6666666666666, - "r_x3": 419.0, - "r_y3": 516.6666666666666, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.96073517, - "from_ocr": true - }, - { - "index": 32, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 389.3333333333333, - "r_y0": 508.3333333333333, - "r_x1": 371.6666666666667, - "r_y1": 508.3333333333333, - "r_x2": 371.6666666666667, - "r_y2": 514.6666666666666, - "r_x3": 389.3333333333333, - "r_y3": 514.6666666666666, - "coord_origin": "TOPLEFT" - }, - "text": "row", - "orig": "row", - "text_direction": "left_to_right", - "confidence": 0.9615368700000001, - "from_ocr": true - }, - { - "index": 33, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 329.0, - "r_y0": 508.3333333333333, - "r_x1": 303.0, - "r_y1": 508.3333333333333, - "r_x2": 303.0, - "r_y2": 517.0, - "r_x3": 329.0, - "r_y3": 517.0, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.9626261100000001, - "from_ocr": true - }, - { - "index": 34, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 299.66666666666663, - "r_y0": 508.3333333333333, - "r_x1": 275.66666666666663, - "r_y1": 508.3333333333333, - "r_x2": 275.66666666666663, - "r_y2": 517.0, - "r_x3": 299.66666666666663, - "r_y3": 517.0, - "coord_origin": "TOPLEFT" - }, - "text": "don't", - "orig": "don't", - "text_direction": "left_to_right", - "confidence": 0.96669136, + "confidence": 95.0, "from_ocr": true } ], @@ -946,16 +471,16 @@ "layout": { "clusters": [ { - "id": 8, - "label": "text", + "id": 0, + "label": "table", "bbox": { - "l": 194.03979, - "t": 690.10254, - "r": 410.73657, - "b": 719.149414, + "l": 240.90093994140625, + "t": 277.41973876953125, + "r": 722.950309753418, + "b": 524.3504486083984, "coord_origin": "TOPLEFT" }, - "confidence": 0.7134009003639221, + "confidence": 0.9790865778923035, "cells": [ { "index": 0, @@ -966,37 +491,22 @@ "a": 255 }, "rect": { - "r_x0": 194.03979, - "r_y0": 719.149414, - "r_x1": 410.73657, - "r_y1": 719.149414, - "r_x2": 410.73657, - "r_y2": 690.10254, - "r_x3": 194.03979, - "r_y3": 690.10254, + "r_x0": 694.6666666666666, + "r_y0": 485.66666666666663, + "r_x1": 602.0, + "r_y1": 485.66666666666663, + "r_x2": 602.0, + "r_y2": 506.3333333333333, + "r_x3": 694.6666666666666, + "r_y3": 506.3333333333333, "coord_origin": "TOPLEFT" }, - "text": " tset elbat a si sihT", - "orig": " tset elbat a si sihT", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - } - ], - "children": [] - }, - { - "id": 0, - "label": "text", - "bbox": { - "l": 238.78076, - "t": 655.42273, - "r": 540.0, - "b": 667.71179, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.8374139070510864, - "cells": [ + "confidence": 90.0, + "from_ocr": true + }, { "index": 1, "rgba": { @@ -1006,21 +516,21 @@ "a": 255 }, "rect": { - "r_x0": 521.0545, - "r_y0": 667.71179, - "r_x1": 540.0, - "r_y1": 667.71179, - "r_x2": 540.0, - "r_y2": 655.42273, - "r_x3": 521.0545, - "r_y3": 655.42273, + "r_x0": 680.0, + "r_y0": 454.33333333333337, + "r_x1": 610.0, + "r_y1": 454.33333333333337, + "r_x2": 610.0, + "r_y2": 475.0, + "r_x3": 680.0, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "ehT", - "orig": "ehT", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true }, { "index": 2, @@ -1031,21 +541,21 @@ "a": 255 }, "rect": { - "r_x0": 518.00269, - "r_y0": 667.71179, - "r_x1": 518.00488, - "r_y1": 667.71179, - "r_x2": 518.00488, - "r_y2": 655.42273, - "r_x3": 518.00269, - "r_y3": 655.42273, + "r_x0": 670.3333333333334, + "r_y0": 392.0, + "r_x1": 623.3333333333334, + "r_y1": 392.0, + "r_x2": 623.3333333333334, + "r_y2": 408.0, + "r_x3": 670.3333333333334, + "r_y3": 408.0, "coord_origin": "TOPLEFT" }, - "text": " t", - "orig": " t", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 3, @@ -1056,21 +566,21 @@ "a": 255 }, "rect": { - "r_x0": 503.33759000000003, - "r_y0": 667.71179, - "r_x1": 514.95093, - "r_y1": 667.71179, - "r_x2": 514.95093, - "r_y2": 655.42273, - "r_x3": 503.33759000000003, - "r_y3": 655.42273, + "r_x0": 670.3333333333334, + "r_y0": 312.0, + "r_x1": 623.3333333333334, + "r_y1": 312.0, + "r_x2": 623.3333333333334, + "r_y2": 328.0, + "r_x3": 670.3333333333334, + "r_y3": 328.0, "coord_origin": "TOPLEFT" }, - "text": "se", - "orig": "se", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 4, @@ -1081,21 +591,21 @@ "a": 255 }, "rect": { - "r_x0": 500.28534, - "r_y0": 667.71179, - "r_x1": 500.28751, - "r_y1": 667.71179, - "r_x2": 500.28751, - "r_y2": 655.42273, - "r_x3": 500.28534, - "r_y3": 655.42273, + "r_x0": 559.6666666666667, + "r_y0": 485.66666666666663, + "r_x1": 428.3333333333333, + "r_y1": 485.66666666666663, + "r_x2": 428.3333333333333, + "r_y2": 506.3333333333333, + "r_x3": 559.6666666666667, + "r_y3": 506.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "t ", - "orig": "t ", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 5, @@ -1106,21 +616,21 @@ "a": 255 }, "rect": { - "r_x0": 459.36172000000005, - "r_y0": 667.71179, - "r_x1": 497.23352, - "r_y1": 667.71179, - "r_x2": 497.23352, - "r_y2": 655.42273, - "r_x3": 459.36172000000005, - "r_y3": 655.42273, + "r_x0": 526.6666666666667, + "r_y0": 459.0, + "r_x1": 456.0, + "r_y1": 459.0, + "r_x2": 456.0, + "r_y2": 475.0, + "r_x3": 526.6666666666667, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "w strats", - "orig": "w strats", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 6, @@ -1131,21 +641,21 @@ "a": 255 }, "rect": { - "r_x0": 456.92352, - "r_y0": 667.71179, - "r_x1": 456.92526, - "r_y1": 667.71179, - "r_x2": 456.92526, - "r_y2": 655.42273, - "r_x3": 456.92352, - "r_y3": 655.42273, + "r_x0": 545.0, + "r_y0": 408.0, + "r_x1": 442.3333333333333, + "r_y1": 408.0, + "r_x2": 442.3333333333333, + "r_y2": 424.0, + "r_x3": 545.0, + "r_y3": 424.0, "coord_origin": "TOPLEFT" }, - "text": "it", - "orig": "it", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 91.0, + "from_ocr": true }, { "index": 7, @@ -1156,21 +666,21 @@ "a": 255 }, "rect": { - "r_x0": 377.49374, - "r_y0": 667.71179, - "r_x1": 453.87128, - "r_y1": 667.71179, - "r_x2": 453.87128, - "r_y2": 655.42273, - "r_x3": 377.49374, - "r_y3": 655.42273, + "r_x0": 515.0, + "r_y0": 376.0, + "r_x1": 468.0, + "r_y1": 376.0, + "r_x2": 468.0, + "r_y2": 392.0, + "r_x3": 515.0, + "r_y3": 392.0, "coord_origin": "TOPLEFT" }, - "text": "modnar emos h", - "orig": "modnar emos h", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 8, @@ -1181,21 +691,21 @@ "a": 255 }, "rect": { - "r_x0": 374.44409, - "r_y0": 667.71179, - "r_x1": 374.44629, - "r_y1": 667.71179, - "r_x2": 374.44629, - "r_y2": 655.42273, - "r_x3": 374.44409, - "r_y3": 655.42273, + "r_x0": 545.0, + "r_y0": 328.0, + "r_x1": 442.3333333333333, + "r_y1": 328.0, + "r_x2": 442.3333333333333, + "r_y2": 344.0, + "r_x3": 545.0, + "r_y3": 344.0, "coord_origin": "TOPLEFT" }, - "text": " t", - "orig": " t", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 9, @@ -1206,21 +716,21 @@ "a": 255 }, "rect": { - "r_x0": 359.77896, - "r_y0": 667.71179, - "r_x1": 371.3923, - "r_y1": 667.71179, - "r_x2": 371.3923, - "r_y2": 655.42273, - "r_x3": 359.77896, - "r_y3": 655.42273, + "r_x0": 515.0, + "r_y0": 296.6666666666667, + "r_x1": 468.0, + "r_y1": 296.6666666666667, + "r_x2": 468.0, + "r_y2": 312.6666666666667, + "r_x3": 515.0, + "r_y3": 312.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "xe", - "orig": "xe", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 10, @@ -1231,21 +741,21 @@ "a": 255 }, "rect": { - "r_x0": 356.72672, - "r_y0": 667.71179, - "r_x1": 356.72888, - "r_y1": 667.71179, - "r_x2": 356.72888, - "r_y2": 655.42273, - "r_x3": 356.72672, - "r_y3": 655.42273, + "r_x0": 385.6666666666667, + "r_y0": 490.33333333333337, + "r_x1": 274.0, + "r_y1": 490.33333333333337, + "r_x2": 274.0, + "r_y2": 506.3333333333333, + "r_x3": 385.6666666666667, + "r_y3": 506.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "t ", - "orig": "t ", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 11, @@ -1256,21 +766,21 @@ "a": 255 }, "rect": { - "r_x0": 335.3306, - "r_y0": 667.71179, - "r_x1": 353.67493, - "r_y1": 667.71179, - "r_x2": 353.67493, - "r_y2": 655.42273, - "r_x3": 335.3306, - "r_y3": 655.42273, + "r_x0": 363.0, + "r_y0": 459.0, + "r_x1": 292.66666666666663, + "r_y1": 459.0, + "r_x2": 292.66666666666663, + "r_y2": 475.0, + "r_x3": 363.0, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "dna", - "orig": "dna", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 12, @@ -1281,21 +791,21 @@ "a": 255 }, "rect": { - "r_x0": 332.27878, - "r_y0": 667.71179, - "r_x1": 332.28094, - "r_y1": 667.71179, - "r_x2": 332.28094, - "r_y2": 655.42273, - "r_x3": 332.27878, - "r_y3": 655.42273, + "r_x0": 383.6666666666667, + "r_y0": 408.0, + "r_x1": 278.0, + "r_y1": 408.0, + "r_x2": 278.0, + "r_y2": 424.0, + "r_x3": 383.6666666666667, + "r_y3": 424.0, "coord_origin": "TOPLEFT" }, - "text": " t", - "orig": " t", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 13, @@ -1306,21 +816,21 @@ "a": 255 }, "rect": { - "r_x0": 301.7153, - "r_y0": 667.71179, - "r_x1": 329.22699, - "r_y1": 667.71179, - "r_x2": 329.22699, - "r_y2": 655.42273, - "r_x3": 301.7153, - "r_y3": 655.42273, + "r_x0": 351.33333333333337, + "r_y0": 376.0, + "r_x1": 304.33333333333337, + "r_y1": 376.0, + "r_x2": 304.33333333333337, + "r_y2": 392.0, + "r_x3": 351.33333333333337, + "r_y3": 392.0, "coord_origin": "TOPLEFT" }, - "text": "a neh", - "orig": "a neh", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 14, @@ -1331,21 +841,21 @@ "a": 255 }, "rect": { - "r_x0": 298.66348, - "r_y0": 667.71179, - "r_x1": 298.66565, - "r_y1": 667.71179, - "r_x2": 298.66565, - "r_y2": 655.42273, - "r_x3": 298.66348, - "r_y3": 655.42273, + "r_x0": 383.6666666666667, + "r_y0": 328.0, + "r_x1": 278.0, + "r_y1": 328.0, + "r_x2": 278.0, + "r_y2": 344.0, + "r_x3": 383.6666666666667, + "r_y3": 344.0, "coord_origin": "TOPLEFT" }, - "text": " t", - "orig": " t", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 15, @@ -1356,593 +866,38 @@ "a": 255 }, "rect": { - "r_x0": 274.82526, - "r_y0": 667.71179, - "r_x1": 295.61169, - "r_y1": 667.71179, - "r_x2": 295.61169, - "r_y2": 655.42273, - "r_x3": 274.82526, - "r_y3": 655.42273, + "r_x0": 351.33333333333337, + "r_y0": 296.6666666666667, + "r_x1": 304.33333333333337, + "r_y1": 296.6666666666667, + "r_x2": 304.33333333333337, + "r_y2": 312.6666666666667, + "r_x3": 351.33333333333337, + "r_y3": 312.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "elba", - "orig": "elba", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - }, - { - "index": 16, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 271.77344, - "r_y0": 667.71179, - "r_x1": 271.7756, - "r_y1": 667.71179, - "r_x2": 271.7756, - "r_y2": 655.42273, - "r_x3": 271.77344, - "r_y3": 655.42273, - "coord_origin": "TOPLEFT" - }, - "text": " i", - "orig": " i", - "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - }, - { - "index": 17, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 241.83258, - "r_y0": 667.71179, - "r_x1": 269.3335, - "r_y1": 667.71179, - "r_x2": 269.3335, - "r_y2": 655.42273, - "r_x3": 241.83258, - "r_y3": 655.42273, - "coord_origin": "TOPLEFT" - }, - "text": "egam", - "orig": "egam", - "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - }, - { - "index": 18, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 238.78076, - "r_y0": 667.71179, - "r_x1": 238.78296, - "r_y1": 667.71179, - "r_x2": 238.78296, - "r_y2": 655.42273, - "r_x3": 238.78076, - "r_y3": 655.42273, - "coord_origin": "TOPLEFT" - }, - "text": ": ", - "orig": ": ", - "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - } - ], - "children": [] - }, - { - "id": 9, - "label": "table", - "bbox": { - "l": 112.69406127929688, - "t": 489.72344970703125, - "r": 470.0718078613281, - "b": 628.2994995117188, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.6408323049545288, - "cells": [ - { - "index": 19, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 337.0, - "r_y0": 601.0, - "r_x1": 308.0, - "r_y1": 601.0, - "r_x2": 308.0, - "r_y2": 609.6666666666666, - "r_x3": 337.0, - "r_y3": 609.6666666666666, - "coord_origin": "TOPLEFT" - }, - "text": "Some", - "orig": "Some", - "text_direction": "left_to_right", - "confidence": 0.95841644, - "from_ocr": true - }, - { - "index": 20, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 304.0, - "r_y0": 601.0, - "r_x1": 268.33333333333337, - "r_y1": 601.0, - "r_x2": 268.33333333333337, - "r_y2": 609.3333333333334, - "r_x3": 304.0, - "r_y3": 609.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "column", - "orig": "column", - "text_direction": "left_to_right", - "confidence": 0.95624527, - "from_ocr": true - }, - { - "index": 21, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 230.66666666666666, - "r_y0": 601.0, - "r_x1": 201.66666666666669, - "r_y1": 601.0, - "r_x2": 201.66666666666669, - "r_y2": 609.6666666666666, - "r_x3": 230.66666666666666, - "r_y3": 609.6666666666666, - "coord_origin": "TOPLEFT" - }, - "text": "Some", - "orig": "Some", - "text_direction": "left_to_right", - "confidence": 0.96296555, - "from_ocr": true - }, - { - "index": 22, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 197.66666666666669, - "r_y0": 601.0, - "r_x1": 172.0, - "r_y1": 601.0, - "r_x2": 172.0, - "r_y2": 609.3333333333334, - "r_x3": 197.66666666666669, - "r_y3": 609.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.96467484, - "from_ocr": true - }, - { - "index": 23, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 168.66666666666669, - "r_y0": 601.0, - "r_x1": 133.0, - "r_y1": 601.0, - "r_x2": 133.0, - "r_y2": 609.3333333333334, - "r_x3": 168.66666666666669, - "r_y3": 609.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "column", - "orig": "column", - "text_direction": "left_to_right", - "confidence": 0.95497986, - "from_ocr": true - }, - { - "index": 24, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 437.3333333333333, - "r_y0": 554.6666666666666, - "r_x1": 408.3333333333333, - "r_y1": 554.6666666666666, - "r_x2": 408.3333333333333, - "r_y2": 563.3333333333334, - "r_x3": 437.3333333333333, - "r_y3": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "Some", - "orig": "Some", - "text_direction": "left_to_right", - "confidence": 0.95944489, - "from_ocr": true - }, - { - "index": 25, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 404.0, - "r_y0": 554.6666666666666, - "r_x1": 386.3333333333333, - "r_y1": 554.6666666666666, - "r_x2": 386.3333333333333, - "r_y2": 561.0, - "r_x3": 404.0, - "r_y3": 561.0, - "coord_origin": "TOPLEFT" - }, - "text": "row", - "orig": "row", - "text_direction": "left_to_right", - "confidence": 0.9680950199999999, - "from_ocr": true - }, - { - "index": 26, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 326.33333333333337, - "r_y0": 554.6666666666666, - "r_x1": 299.0, - "r_y1": 554.6666666666666, - "r_x2": 299.0, - "r_y2": 561.0, - "r_x3": 326.33333333333337, - "r_y3": 561.0, - "coord_origin": "TOPLEFT" - }, - "text": "some", - "orig": "some", - "text_direction": "left_to_right", - "confidence": 0.9569136, - "from_ocr": true - }, - { - "index": 27, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 295.33333333333337, - "r_y0": 554.6666666666666, - "r_x1": 279.0, - "r_y1": 554.6666666666666, - "r_x2": 279.0, - "r_y2": 563.3333333333334, - "r_x3": 295.33333333333337, - "r_y3": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "cell", - "orig": "cell", - "text_direction": "left_to_right", - "confidence": 0.9622145799999999, - "from_ocr": true - }, - { - "index": 28, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 213.66666666666666, - "r_y0": 554.6666666666666, - "r_x1": 190.0, - "r_y1": 554.6666666666666, - "r_x2": 190.0, - "r_y2": 563.3333333333334, - "r_x3": 213.66666666666666, - "r_y3": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "have", - "orig": "have", - "text_direction": "left_to_right", - "confidence": 0.96403, - "from_ocr": true - }, - { - "index": 29, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 186.0, - "r_y0": 554.6666666666666, - "r_x1": 149.0, - "r_y1": 554.6666666666666, - "r_x2": 149.0, - "r_y2": 563.0, - "r_x3": 186.0, - "r_y3": 563.0, - "coord_origin": "TOPLEFT" - }, - "text": "content", - "orig": "content", - "text_direction": "left_to_right", - "confidence": 0.96691612, - "from_ocr": true - }, - { - "index": 30, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 451.6666666666667, - "r_y0": 508.3333333333333, - "r_x1": 422.6666666666667, - "r_y1": 508.3333333333333, - "r_x2": 422.6666666666667, - "r_y2": 517.0, - "r_x3": 451.6666666666667, - "r_y3": 517.0, - "coord_origin": "TOPLEFT" - }, - "text": "Some", - "orig": "Some", - "text_direction": "left_to_right", - "confidence": 0.9684503200000001, - "from_ocr": true - }, - { - "index": 31, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 419.0, - "r_y0": 508.3333333333333, - "r_x1": 393.0, - "r_y1": 508.3333333333333, - "r_x2": 393.0, - "r_y2": 516.6666666666666, - "r_x3": 419.0, - "r_y3": 516.6666666666666, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.96073517, - "from_ocr": true - }, - { - "index": 32, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 389.3333333333333, - "r_y0": 508.3333333333333, - "r_x1": 371.6666666666667, - "r_y1": 508.3333333333333, - "r_x2": 371.6666666666667, - "r_y2": 514.6666666666666, - "r_x3": 389.3333333333333, - "r_y3": 514.6666666666666, - "coord_origin": "TOPLEFT" - }, - "text": "row", - "orig": "row", - "text_direction": "left_to_right", - "confidence": 0.9615368700000001, - "from_ocr": true - }, - { - "index": 33, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 329.0, - "r_y0": 508.3333333333333, - "r_x1": 303.0, - "r_y1": 508.3333333333333, - "r_x2": 303.0, - "r_y2": 517.0, - "r_x3": 329.0, - "r_y3": 517.0, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.9626261100000001, - "from_ocr": true - }, - { - "index": 34, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 299.66666666666663, - "r_y0": 508.3333333333333, - "r_x1": 275.66666666666663, - "r_y1": 508.3333333333333, - "r_x2": 275.66666666666663, - "r_y2": 517.0, - "r_x3": 299.66666666666663, - "r_y3": 517.0, - "coord_origin": "TOPLEFT" - }, - "text": "don't", - "orig": "don't", - "text_direction": "left_to_right", - "confidence": 0.96669136, + "confidence": 95.0, "from_ocr": true } ], "children": [ - { - "id": 7, - "label": "text", - "bbox": { - "l": 268.33333333333337, - "t": 601.0, - "r": 337.0, - "b": 609.6666666666666, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.7441245913505554, - "cells": [ - { - "index": 19, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 337.0, - "r_y0": 601.0, - "r_x1": 308.0, - "r_y1": 601.0, - "r_x2": 308.0, - "r_y2": 609.6666666666666, - "r_x3": 337.0, - "r_y3": 609.6666666666666, - "coord_origin": "TOPLEFT" - }, - "text": "Some", - "orig": "Some", - "text_direction": "left_to_right", - "confidence": 0.95841644, - "from_ocr": true - }, - { - "index": 20, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 304.0, - "r_y0": 601.0, - "r_x1": 268.33333333333337, - "r_y1": 601.0, - "r_x2": 268.33333333333337, - "r_y2": 609.3333333333334, - "r_x3": 304.0, - "r_y3": 609.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "column", - "orig": "column", - "text_direction": "left_to_right", - "confidence": 0.95624527, - "from_ocr": true - } - ], - "children": [] - }, { "id": 1, "label": "text", "bbox": { - "l": 133.0, - "t": 601.0, - "r": 230.66666666666666, - "b": 609.6666666666666, + "l": 602.0, + "t": 485.66666666666663, + "r": 694.6666666666666, + "b": 506.3333333333333, "coord_origin": "TOPLEFT" }, - "confidence": 0.7668525576591492, + "confidence": 90.0, "cells": [ { - "index": 21, + "index": 0, "rgba": { "r": 0, "g": 0, @@ -1950,135 +905,20 @@ "a": 255 }, "rect": { - "r_x0": 230.66666666666666, - "r_y0": 601.0, - "r_x1": 201.66666666666669, - "r_y1": 601.0, - "r_x2": 201.66666666666669, - "r_y2": 609.6666666666666, - "r_x3": 230.66666666666666, - "r_y3": 609.6666666666666, + "r_x0": 694.6666666666666, + "r_y0": 485.66666666666663, + "r_x1": 602.0, + "r_y1": 485.66666666666663, + "r_x2": 602.0, + "r_y2": 506.3333333333333, + "r_x3": 694.6666666666666, + "r_y3": 506.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 0.96296555, - "from_ocr": true - }, - { - "index": 22, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 197.66666666666669, - "r_y0": 601.0, - "r_x1": 172.0, - "r_y1": 601.0, - "r_x2": 172.0, - "r_y2": 609.3333333333334, - "r_x3": 197.66666666666669, - "r_y3": 609.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.96467484, - "from_ocr": true - }, - { - "index": 23, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 168.66666666666669, - "r_y0": 601.0, - "r_x1": 133.0, - "r_y1": 601.0, - "r_x2": 133.0, - "r_y2": 609.3333333333334, - "r_x3": 168.66666666666669, - "r_y3": 609.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "column", - "orig": "column", - "text_direction": "left_to_right", - "confidence": 0.95497986, - "from_ocr": true - } - ], - "children": [] - }, - { - "id": 4, - "label": "text", - "bbox": { - "l": 386.3333333333333, - "t": 554.6666666666666, - "r": 437.3333333333333, - "b": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.7588309049606323, - "cells": [ - { - "index": 24, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 437.3333333333333, - "r_y0": 554.6666666666666, - "r_x1": 408.3333333333333, - "r_y1": 554.6666666666666, - "r_x2": 408.3333333333333, - "r_y2": 563.3333333333334, - "r_x3": 437.3333333333333, - "r_y3": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "Some", - "orig": "Some", - "text_direction": "left_to_right", - "confidence": 0.95944489, - "from_ocr": true - }, - { - "index": 25, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 404.0, - "r_y0": 554.6666666666666, - "r_x1": 386.3333333333333, - "r_y1": 554.6666666666666, - "r_x2": 386.3333333333333, - "r_y2": 561.0, - "r_x3": 404.0, - "r_y3": 561.0, - "coord_origin": "TOPLEFT" - }, - "text": "row", - "orig": "row", - "text_direction": "left_to_right", - "confidence": 0.9680950199999999, + "confidence": 90.0, "from_ocr": true } ], @@ -2088,16 +928,16 @@ "id": 2, "label": "text", "bbox": { - "l": 279.0, - "t": 554.6666666666666, - "r": 326.33333333333337, - "b": 563.3333333333334, + "l": 610.0, + "t": 454.33333333333337, + "r": 680.0, + "b": 475.0, "coord_origin": "TOPLEFT" }, - "confidence": 0.7627862095832825, + "confidence": 90.0, "cells": [ { - "index": 26, + "index": 1, "rgba": { "r": 0, "g": 0, @@ -2105,110 +945,20 @@ "a": 255 }, "rect": { - "r_x0": 326.33333333333337, - "r_y0": 554.6666666666666, - "r_x1": 299.0, - "r_y1": 554.6666666666666, - "r_x2": 299.0, - "r_y2": 561.0, - "r_x3": 326.33333333333337, - "r_y3": 561.0, + "r_x0": 680.0, + "r_y0": 454.33333333333337, + "r_x1": 610.0, + "r_y1": 454.33333333333337, + "r_x2": 610.0, + "r_y2": 475.0, + "r_x3": 680.0, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "some", - "orig": "some", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 0.9569136, - "from_ocr": true - }, - { - "index": 27, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 295.33333333333337, - "r_y0": 554.6666666666666, - "r_x1": 279.0, - "r_y1": 554.6666666666666, - "r_x2": 279.0, - "r_y2": 563.3333333333334, - "r_x3": 295.33333333333337, - "r_y3": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "cell", - "orig": "cell", - "text_direction": "left_to_right", - "confidence": 0.9622145799999999, - "from_ocr": true - } - ], - "children": [] - }, - { - "id": 5, - "label": "text", - "bbox": { - "l": 149.0, - "t": 554.6666666666666, - "r": 213.66666666666666, - "b": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.7541249394416809, - "cells": [ - { - "index": 28, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 213.66666666666666, - "r_y0": 554.6666666666666, - "r_x1": 190.0, - "r_y1": 554.6666666666666, - "r_x2": 190.0, - "r_y2": 563.3333333333334, - "r_x3": 213.66666666666666, - "r_y3": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "have", - "orig": "have", - "text_direction": "left_to_right", - "confidence": 0.96403, - "from_ocr": true - }, - { - "index": 29, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 186.0, - "r_y0": 554.6666666666666, - "r_x1": 149.0, - "r_y1": 554.6666666666666, - "r_x2": 149.0, - "r_y2": 563.0, - "r_x3": 186.0, - "r_y3": 563.0, - "coord_origin": "TOPLEFT" - }, - "text": "content", - "orig": "content", - "text_direction": "left_to_right", - "confidence": 0.96691612, + "confidence": 90.0, "from_ocr": true } ], @@ -2218,16 +968,16 @@ "id": 3, "label": "text", "bbox": { - "l": 371.6666666666667, - "t": 508.3333333333333, - "r": 451.6666666666667, - "b": 517.0, + "l": 623.3333333333334, + "t": 392.0, + "r": 670.3333333333334, + "b": 408.0, "coord_origin": "TOPLEFT" }, - "confidence": 0.7616423964500427, + "confidence": 96.0, "cells": [ { - "index": 30, + "index": 2, "rgba": { "r": 0, "g": 0, @@ -2235,24 +985,39 @@ "a": 255 }, "rect": { - "r_x0": 451.6666666666667, - "r_y0": 508.3333333333333, - "r_x1": 422.6666666666667, - "r_y1": 508.3333333333333, - "r_x2": 422.6666666666667, - "r_y2": 517.0, - "r_x3": 451.6666666666667, - "r_y3": 517.0, + "r_x0": 670.3333333333334, + "r_y0": 392.0, + "r_x1": 623.3333333333334, + "r_y1": 392.0, + "r_x2": 623.3333333333334, + "r_y2": 408.0, + "r_x3": 670.3333333333334, + "r_y3": 408.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9684503200000001, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 4, + "label": "text", + "bbox": { + "l": 623.3333333333334, + "t": 312.0, + "r": 670.3333333333334, + "b": 328.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ { - "index": 31, + "index": 3, "rgba": { "r": 0, "g": 0, @@ -2260,24 +1025,39 @@ "a": 255 }, "rect": { - "r_x0": 419.0, - "r_y0": 508.3333333333333, - "r_x1": 393.0, - "r_y1": 508.3333333333333, - "r_x2": 393.0, - "r_y2": 516.6666666666666, - "r_x3": 419.0, - "r_y3": 516.6666666666666, + "r_x0": 670.3333333333334, + "r_y0": 312.0, + "r_x1": 623.3333333333334, + "r_y1": 312.0, + "r_x2": 623.3333333333334, + "r_y2": 328.0, + "r_x3": 670.3333333333334, + "r_y3": 328.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96073517, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 5, + "label": "text", + "bbox": { + "l": 428.3333333333333, + "t": 485.66666666666663, + "r": 559.6666666666667, + "b": 506.3333333333333, + "coord_origin": "TOPLEFT" + }, + "confidence": 92.0, + "cells": [ { - "index": 32, + "index": 4, "rgba": { "r": 0, "g": 0, @@ -2285,20 +1065,20 @@ "a": 255 }, "rect": { - "r_x0": 389.3333333333333, - "r_y0": 508.3333333333333, - "r_x1": 371.6666666666667, - "r_y1": 508.3333333333333, - "r_x2": 371.6666666666667, - "r_y2": 514.6666666666666, - "r_x3": 389.3333333333333, - "r_y3": 514.6666666666666, + "r_x0": 559.6666666666667, + "r_y0": 485.66666666666663, + "r_x1": 428.3333333333333, + "r_y1": 485.66666666666663, + "r_x2": 428.3333333333333, + "r_y2": 506.3333333333333, + "r_x3": 559.6666666666667, + "r_y3": 506.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 0.9615368700000001, + "confidence": 92.0, "from_ocr": true } ], @@ -2308,16 +1088,16 @@ "id": 6, "label": "text", "bbox": { - "l": 275.66666666666663, - "t": 508.3333333333333, - "r": 329.0, - "b": 517.0, + "l": 456.0, + "t": 459.0, + "r": 526.6666666666667, + "b": 475.0, "coord_origin": "TOPLEFT" }, - "confidence": 0.7468306422233582, + "confidence": 94.0, "cells": [ { - "index": 33, + "index": 5, "rgba": { "r": 0, "g": 0, @@ -2325,24 +1105,39 @@ "a": 255 }, "rect": { - "r_x0": 329.0, - "r_y0": 508.3333333333333, - "r_x1": 303.0, - "r_y1": 508.3333333333333, - "r_x2": 303.0, - "r_y2": 517.0, - "r_x3": 329.0, - "r_y3": 517.0, + "r_x0": 526.6666666666667, + "r_y0": 459.0, + "r_x1": 456.0, + "r_y1": 459.0, + "r_x2": 456.0, + "r_y2": 475.0, + "r_x3": 526.6666666666667, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9626261100000001, + "confidence": 94.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 7, + "label": "text", + "bbox": { + "l": 442.3333333333333, + "t": 408.0, + "r": 545.0, + "b": 424.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 91.0, + "cells": [ { - "index": 34, + "index": 6, "rgba": { "r": 0, "g": 0, @@ -2350,20 +1145,380 @@ "a": 255 }, "rect": { - "r_x0": 299.66666666666663, - "r_y0": 508.3333333333333, - "r_x1": 275.66666666666663, - "r_y1": 508.3333333333333, - "r_x2": 275.66666666666663, - "r_y2": 517.0, - "r_x3": 299.66666666666663, - "r_y3": 517.0, + "r_x0": 545.0, + "r_y0": 408.0, + "r_x1": 442.3333333333333, + "r_y1": 408.0, + "r_x2": 442.3333333333333, + "r_y2": 424.0, + "r_x3": 545.0, + "r_y3": 424.0, "coord_origin": "TOPLEFT" }, - "text": "don't", - "orig": "don't", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.96669136, + "confidence": 91.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 8, + "label": "text", + "bbox": { + "l": 468.0, + "t": 376.0, + "r": 515.0, + "b": 392.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ + { + "index": 7, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 515.0, + "r_y0": 376.0, + "r_x1": 468.0, + "r_y1": 376.0, + "r_x2": 468.0, + "r_y2": 392.0, + "r_x3": 515.0, + "r_y3": 392.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 9, + "label": "text", + "bbox": { + "l": 442.3333333333333, + "t": 328.0, + "r": 545.0, + "b": 344.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ + { + "index": 8, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 545.0, + "r_y0": 328.0, + "r_x1": 442.3333333333333, + "r_y1": 328.0, + "r_x2": 442.3333333333333, + "r_y2": 344.0, + "r_x3": 545.0, + "r_y3": 344.0, + "coord_origin": "TOPLEFT" + }, + "text": "Some other", + "orig": "Some other", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 10, + "label": "text", + "bbox": { + "l": 468.0, + "t": 296.6666666666667, + "r": 515.0, + "b": 312.6666666666667, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 9, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 515.0, + "r_y0": 296.6666666666667, + "r_x1": 468.0, + "r_y1": 296.6666666666667, + "r_x2": 468.0, + "r_y2": 312.6666666666667, + "r_x3": 515.0, + "r_y3": 312.6666666666667, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 11, + "label": "text", + "bbox": { + "l": 274.0, + "t": 490.33333333333337, + "r": 385.6666666666667, + "b": 506.3333333333333, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 10, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 385.6666666666667, + "r_y0": 490.33333333333337, + "r_x1": 274.0, + "r_y1": 490.33333333333337, + "r_x2": 274.0, + "r_y2": 506.3333333333333, + "r_x3": 385.6666666666667, + "r_y3": 506.3333333333333, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 12, + "label": "text", + "bbox": { + "l": 292.66666666666663, + "t": 459.0, + "r": 363.0, + "b": 475.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ + { + "index": 11, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 363.0, + "r_y0": 459.0, + "r_x1": 292.66666666666663, + "r_y1": 459.0, + "r_x2": 292.66666666666663, + "r_y2": 475.0, + "r_x3": 363.0, + "r_y3": 475.0, + "coord_origin": "TOPLEFT" + }, + "text": "column", + "orig": "column", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 13, + "label": "text", + "bbox": { + "l": 278.0, + "t": 408.0, + "r": 383.6666666666667, + "b": 424.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ + { + "index": 12, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 383.6666666666667, + "r_y0": 408.0, + "r_x1": 278.0, + "r_y1": 408.0, + "r_x2": 278.0, + "r_y2": 424.0, + "r_x3": 383.6666666666667, + "r_y3": 424.0, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 14, + "label": "text", + "bbox": { + "l": 304.33333333333337, + "t": 376.0, + "r": 351.33333333333337, + "b": 392.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 351.33333333333337, + "r_y0": 376.0, + "r_x1": 304.33333333333337, + "r_y1": 376.0, + "r_x2": 304.33333333333337, + "r_y2": 392.0, + "r_x3": 351.33333333333337, + "r_y3": 392.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 15, + "label": "text", + "bbox": { + "l": 278.0, + "t": 328.0, + "r": 383.6666666666667, + "b": 344.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 383.6666666666667, + "r_y0": 328.0, + "r_x1": 278.0, + "r_y1": 328.0, + "r_x2": 278.0, + "r_y2": 344.0, + "r_x3": 383.6666666666667, + "r_y3": 344.0, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 16, + "label": "text", + "bbox": { + "l": 304.33333333333337, + "t": 296.6666666666667, + "r": 351.33333333333337, + "b": 312.6666666666667, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 351.33333333333337, + "r_y0": 296.6666666666667, + "r_x1": 304.33333333333337, + "r_y1": 296.6666666666667, + "r_x2": 304.33333333333337, + "r_y2": 312.6666666666667, + "r_x3": 351.33333333333337, + "r_y3": 312.6666666666667, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, "from_ocr": true } ], @@ -2375,24 +1530,24 @@ }, "tablestructure": { "table_map": { - "9": { + "0": { "label": "table", - "id": 9, + "id": 0, "page_no": 0, "cluster": { - "id": 9, + "id": 0, "label": "table", "bbox": { - "l": 112.69406127929688, - "t": 489.72344970703125, - "r": 470.0718078613281, - "b": 628.2994995117188, + "l": 240.90093994140625, + "t": 277.41973876953125, + "r": 722.950309753418, + "b": 524.3504486083984, "coord_origin": "TOPLEFT" }, - "confidence": 0.6408323049545288, + "confidence": 0.9790865778923035, "cells": [ { - "index": 19, + "index": 0, "rgba": { "r": 0, "g": 0, @@ -2400,24 +1555,24 @@ "a": 255 }, "rect": { - "r_x0": 337.0, - "r_y0": 601.0, - "r_x1": 308.0, - "r_y1": 601.0, - "r_x2": 308.0, - "r_y2": 609.6666666666666, - "r_x3": 337.0, - "r_y3": 609.6666666666666, + "r_x0": 694.6666666666666, + "r_y0": 485.66666666666663, + "r_x1": 602.0, + "r_y1": 485.66666666666663, + "r_x2": 602.0, + "r_y2": 506.3333333333333, + "r_x3": 694.6666666666666, + "r_y3": 506.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 0.95841644, + "confidence": 90.0, "from_ocr": true }, { - "index": 20, + "index": 1, "rgba": { "r": 0, "g": 0, @@ -2425,24 +1580,124 @@ "a": 255 }, "rect": { - "r_x0": 304.0, - "r_y0": 601.0, - "r_x1": 268.33333333333337, - "r_y1": 601.0, - "r_x2": 268.33333333333337, - "r_y2": 609.3333333333334, - "r_x3": 304.0, - "r_y3": 609.3333333333334, + "r_x0": 680.0, + "r_y0": 454.33333333333337, + "r_x1": 610.0, + "r_y1": 454.33333333333337, + "r_x2": 610.0, + "r_y2": 475.0, + "r_x3": 680.0, + "r_y3": 475.0, + "coord_origin": "TOPLEFT" + }, + "text": "merged", + "orig": "merged", + "text_direction": "left_to_right", + "confidence": 90.0, + "from_ocr": true + }, + { + "index": 2, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 670.3333333333334, + "r_y0": 392.0, + "r_x1": 623.3333333333334, + "r_y1": 392.0, + "r_x2": 623.3333333333334, + "r_y2": 408.0, + "r_x3": 670.3333333333334, + "r_y3": 408.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + }, + { + "index": 3, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 670.3333333333334, + "r_y0": 312.0, + "r_x1": 623.3333333333334, + "r_y1": 312.0, + "r_x2": 623.3333333333334, + "r_y2": 328.0, + "r_x3": 670.3333333333334, + "r_y3": 328.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + }, + { + "index": 4, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 559.6666666666667, + "r_y0": 485.66666666666663, + "r_x1": 428.3333333333333, + "r_y1": 485.66666666666663, + "r_x2": 428.3333333333333, + "r_y2": 506.3333333333333, + "r_x3": 559.6666666666667, + "r_y3": 506.3333333333333, + "coord_origin": "TOPLEFT" + }, + "text": "Other merged", + "orig": "Other merged", + "text_direction": "left_to_right", + "confidence": 92.0, + "from_ocr": true + }, + { + "index": 5, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 526.6666666666667, + "r_y0": 459.0, + "r_x1": 456.0, + "r_y1": 459.0, + "r_x2": 456.0, + "r_y2": 475.0, + "r_x3": 526.6666666666667, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, "text": "column", "orig": "column", "text_direction": "left_to_right", - "confidence": 0.95624527, + "confidence": 94.0, "from_ocr": true }, { - "index": 21, + "index": 6, "rgba": { "r": 0, "g": 0, @@ -2450,24 +1705,24 @@ "a": 255 }, "rect": { - "r_x0": 230.66666666666666, - "r_y0": 601.0, - "r_x1": 201.66666666666669, - "r_y1": 601.0, - "r_x2": 201.66666666666669, - "r_y2": 609.6666666666666, - "r_x3": 230.66666666666666, - "r_y3": 609.6666666666666, + "r_x0": 545.0, + "r_y0": 408.0, + "r_x1": 442.3333333333333, + "r_y1": 408.0, + "r_x2": 442.3333333333333, + "r_y2": 424.0, + "r_x3": 545.0, + "r_y3": 424.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.96296555, + "confidence": 91.0, "from_ocr": true }, { - "index": 22, + "index": 7, "rgba": { "r": 0, "g": 0, @@ -2475,24 +1730,24 @@ "a": 255 }, "rect": { - "r_x0": 197.66666666666669, - "r_y0": 601.0, - "r_x1": 172.0, - "r_y1": 601.0, - "r_x2": 172.0, - "r_y2": 609.3333333333334, - "r_x3": 197.66666666666669, - "r_y3": 609.3333333333334, + "r_x0": 515.0, + "r_y0": 376.0, + "r_x1": 468.0, + "r_y1": 376.0, + "r_x2": 468.0, + "r_y2": 392.0, + "r_x3": 515.0, + "r_y3": 392.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96467484, + "confidence": 96.0, "from_ocr": true }, { - "index": 23, + "index": 8, "rgba": { "r": 0, "g": 0, @@ -2500,24 +1755,99 @@ "a": 255 }, "rect": { - "r_x0": 168.66666666666669, - "r_y0": 601.0, - "r_x1": 133.0, - "r_y1": 601.0, - "r_x2": 133.0, - "r_y2": 609.3333333333334, - "r_x3": 168.66666666666669, - "r_y3": 609.3333333333334, + "r_x0": 545.0, + "r_y0": 328.0, + "r_x1": 442.3333333333333, + "r_y1": 328.0, + "r_x2": 442.3333333333333, + "r_y2": 344.0, + "r_x3": 545.0, + "r_y3": 344.0, + "coord_origin": "TOPLEFT" + }, + "text": "Some other", + "orig": "Some other", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + }, + { + "index": 9, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 515.0, + "r_y0": 296.6666666666667, + "r_x1": 468.0, + "r_y1": 296.6666666666667, + "r_x2": 468.0, + "r_y2": 312.6666666666667, + "r_x3": 515.0, + "r_y3": 312.6666666666667, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 10, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 385.6666666666667, + "r_y0": 490.33333333333337, + "r_x1": 274.0, + "r_y1": 490.33333333333337, + "r_x2": 274.0, + "r_y2": 506.3333333333333, + "r_x3": 385.6666666666667, + "r_y3": 506.3333333333333, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 11, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 363.0, + "r_y0": 459.0, + "r_x1": 292.66666666666663, + "r_y1": 459.0, + "r_x2": 292.66666666666663, + "r_y2": 475.0, + "r_x3": 363.0, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, "text": "column", "orig": "column", "text_direction": "left_to_right", - "confidence": 0.95497986, + "confidence": 94.0, "from_ocr": true }, { - "index": 24, + "index": 12, "rgba": { "r": 0, "g": 0, @@ -2525,24 +1855,24 @@ "a": 255 }, "rect": { - "r_x0": 437.3333333333333, - "r_y0": 554.6666666666666, - "r_x1": 408.3333333333333, - "r_y1": 554.6666666666666, - "r_x2": 408.3333333333333, - "r_y2": 563.3333333333334, - "r_x3": 437.3333333333333, - "r_y3": 563.3333333333334, + "r_x0": 383.6666666666667, + "r_y0": 408.0, + "r_x1": 278.0, + "r_y1": 408.0, + "r_x2": 278.0, + "r_y2": 424.0, + "r_x3": 383.6666666666667, + "r_y3": 424.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.95944489, + "confidence": 94.0, "from_ocr": true }, { - "index": 25, + "index": 13, "rgba": { "r": 0, "g": 0, @@ -2550,24 +1880,24 @@ "a": 255 }, "rect": { - "r_x0": 404.0, - "r_y0": 554.6666666666666, - "r_x1": 386.3333333333333, - "r_y1": 554.6666666666666, - "r_x2": 386.3333333333333, - "r_y2": 561.0, - "r_x3": 404.0, - "r_y3": 561.0, + "r_x0": 351.33333333333337, + "r_y0": 376.0, + "r_x1": 304.33333333333337, + "r_y1": 376.0, + "r_x2": 304.33333333333337, + "r_y2": 392.0, + "r_x3": 351.33333333333337, + "r_y3": 392.0, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9680950199999999, + "confidence": 96.0, "from_ocr": true }, { - "index": 26, + "index": 14, "rgba": { "r": 0, "g": 0, @@ -2575,24 +1905,24 @@ "a": 255 }, "rect": { - "r_x0": 326.33333333333337, - "r_y0": 554.6666666666666, - "r_x1": 299.0, - "r_y1": 554.6666666666666, - "r_x2": 299.0, - "r_y2": 561.0, - "r_x3": 326.33333333333337, - "r_y3": 561.0, + "r_x0": 383.6666666666667, + "r_y0": 328.0, + "r_x1": 278.0, + "r_y1": 328.0, + "r_x2": 278.0, + "r_y2": 344.0, + "r_x3": 383.6666666666667, + "r_y3": 344.0, "coord_origin": "TOPLEFT" }, - "text": "some", - "orig": "some", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.9569136, + "confidence": 94.0, "from_ocr": true }, { - "index": 27, + "index": 15, "rgba": { "r": 0, "g": 0, @@ -2600,278 +1930,38 @@ "a": 255 }, "rect": { - "r_x0": 295.33333333333337, - "r_y0": 554.6666666666666, - "r_x1": 279.0, - "r_y1": 554.6666666666666, - "r_x2": 279.0, - "r_y2": 563.3333333333334, - "r_x3": 295.33333333333337, - "r_y3": 563.3333333333334, + "r_x0": 351.33333333333337, + "r_y0": 296.6666666666667, + "r_x1": 304.33333333333337, + "r_y1": 296.6666666666667, + "r_x2": 304.33333333333337, + "r_y2": 312.6666666666667, + "r_x3": 351.33333333333337, + "r_y3": 312.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "cell", - "orig": "cell", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9622145799999999, - "from_ocr": true - }, - { - "index": 28, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 213.66666666666666, - "r_y0": 554.6666666666666, - "r_x1": 190.0, - "r_y1": 554.6666666666666, - "r_x2": 190.0, - "r_y2": 563.3333333333334, - "r_x3": 213.66666666666666, - "r_y3": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "have", - "orig": "have", - "text_direction": "left_to_right", - "confidence": 0.96403, - "from_ocr": true - }, - { - "index": 29, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 186.0, - "r_y0": 554.6666666666666, - "r_x1": 149.0, - "r_y1": 554.6666666666666, - "r_x2": 149.0, - "r_y2": 563.0, - "r_x3": 186.0, - "r_y3": 563.0, - "coord_origin": "TOPLEFT" - }, - "text": "content", - "orig": "content", - "text_direction": "left_to_right", - "confidence": 0.96691612, - "from_ocr": true - }, - { - "index": 30, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 451.6666666666667, - "r_y0": 508.3333333333333, - "r_x1": 422.6666666666667, - "r_y1": 508.3333333333333, - "r_x2": 422.6666666666667, - "r_y2": 517.0, - "r_x3": 451.6666666666667, - "r_y3": 517.0, - "coord_origin": "TOPLEFT" - }, - "text": "Some", - "orig": "Some", - "text_direction": "left_to_right", - "confidence": 0.9684503200000001, - "from_ocr": true - }, - { - "index": 31, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 419.0, - "r_y0": 508.3333333333333, - "r_x1": 393.0, - "r_y1": 508.3333333333333, - "r_x2": 393.0, - "r_y2": 516.6666666666666, - "r_x3": 419.0, - "r_y3": 516.6666666666666, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.96073517, - "from_ocr": true - }, - { - "index": 32, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 389.3333333333333, - "r_y0": 508.3333333333333, - "r_x1": 371.6666666666667, - "r_y1": 508.3333333333333, - "r_x2": 371.6666666666667, - "r_y2": 514.6666666666666, - "r_x3": 389.3333333333333, - "r_y3": 514.6666666666666, - "coord_origin": "TOPLEFT" - }, - "text": "row", - "orig": "row", - "text_direction": "left_to_right", - "confidence": 0.9615368700000001, - "from_ocr": true - }, - { - "index": 33, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 329.0, - "r_y0": 508.3333333333333, - "r_x1": 303.0, - "r_y1": 508.3333333333333, - "r_x2": 303.0, - "r_y2": 517.0, - "r_x3": 329.0, - "r_y3": 517.0, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.9626261100000001, - "from_ocr": true - }, - { - "index": 34, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 299.66666666666663, - "r_y0": 508.3333333333333, - "r_x1": 275.66666666666663, - "r_y1": 508.3333333333333, - "r_x2": 275.66666666666663, - "r_y2": 517.0, - "r_x3": 299.66666666666663, - "r_y3": 517.0, - "coord_origin": "TOPLEFT" - }, - "text": "don't", - "orig": "don't", - "text_direction": "left_to_right", - "confidence": 0.96669136, + "confidence": 95.0, "from_ocr": true } ], "children": [ - { - "id": 7, - "label": "text", - "bbox": { - "l": 268.33333333333337, - "t": 601.0, - "r": 337.0, - "b": 609.6666666666666, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.7441245913505554, - "cells": [ - { - "index": 19, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 337.0, - "r_y0": 601.0, - "r_x1": 308.0, - "r_y1": 601.0, - "r_x2": 308.0, - "r_y2": 609.6666666666666, - "r_x3": 337.0, - "r_y3": 609.6666666666666, - "coord_origin": "TOPLEFT" - }, - "text": "Some", - "orig": "Some", - "text_direction": "left_to_right", - "confidence": 0.95841644, - "from_ocr": true - }, - { - "index": 20, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 304.0, - "r_y0": 601.0, - "r_x1": 268.33333333333337, - "r_y1": 601.0, - "r_x2": 268.33333333333337, - "r_y2": 609.3333333333334, - "r_x3": 304.0, - "r_y3": 609.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "column", - "orig": "column", - "text_direction": "left_to_right", - "confidence": 0.95624527, - "from_ocr": true - } - ], - "children": [] - }, { "id": 1, "label": "text", "bbox": { - "l": 133.0, - "t": 601.0, - "r": 230.66666666666666, - "b": 609.6666666666666, + "l": 602.0, + "t": 485.66666666666663, + "r": 694.6666666666666, + "b": 506.3333333333333, "coord_origin": "TOPLEFT" }, - "confidence": 0.7668525576591492, + "confidence": 90.0, "cells": [ { - "index": 21, + "index": 0, "rgba": { "r": 0, "g": 0, @@ -2879,135 +1969,20 @@ "a": 255 }, "rect": { - "r_x0": 230.66666666666666, - "r_y0": 601.0, - "r_x1": 201.66666666666669, - "r_y1": 601.0, - "r_x2": 201.66666666666669, - "r_y2": 609.6666666666666, - "r_x3": 230.66666666666666, - "r_y3": 609.6666666666666, + "r_x0": 694.6666666666666, + "r_y0": 485.66666666666663, + "r_x1": 602.0, + "r_y1": 485.66666666666663, + "r_x2": 602.0, + "r_y2": 506.3333333333333, + "r_x3": 694.6666666666666, + "r_y3": 506.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 0.96296555, - "from_ocr": true - }, - { - "index": 22, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 197.66666666666669, - "r_y0": 601.0, - "r_x1": 172.0, - "r_y1": 601.0, - "r_x2": 172.0, - "r_y2": 609.3333333333334, - "r_x3": 197.66666666666669, - "r_y3": 609.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.96467484, - "from_ocr": true - }, - { - "index": 23, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 168.66666666666669, - "r_y0": 601.0, - "r_x1": 133.0, - "r_y1": 601.0, - "r_x2": 133.0, - "r_y2": 609.3333333333334, - "r_x3": 168.66666666666669, - "r_y3": 609.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "column", - "orig": "column", - "text_direction": "left_to_right", - "confidence": 0.95497986, - "from_ocr": true - } - ], - "children": [] - }, - { - "id": 4, - "label": "text", - "bbox": { - "l": 386.3333333333333, - "t": 554.6666666666666, - "r": 437.3333333333333, - "b": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.7588309049606323, - "cells": [ - { - "index": 24, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 437.3333333333333, - "r_y0": 554.6666666666666, - "r_x1": 408.3333333333333, - "r_y1": 554.6666666666666, - "r_x2": 408.3333333333333, - "r_y2": 563.3333333333334, - "r_x3": 437.3333333333333, - "r_y3": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "Some", - "orig": "Some", - "text_direction": "left_to_right", - "confidence": 0.95944489, - "from_ocr": true - }, - { - "index": 25, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 404.0, - "r_y0": 554.6666666666666, - "r_x1": 386.3333333333333, - "r_y1": 554.6666666666666, - "r_x2": 386.3333333333333, - "r_y2": 561.0, - "r_x3": 404.0, - "r_y3": 561.0, - "coord_origin": "TOPLEFT" - }, - "text": "row", - "orig": "row", - "text_direction": "left_to_right", - "confidence": 0.9680950199999999, + "confidence": 90.0, "from_ocr": true } ], @@ -3017,16 +1992,16 @@ "id": 2, "label": "text", "bbox": { - "l": 279.0, - "t": 554.6666666666666, - "r": 326.33333333333337, - "b": 563.3333333333334, + "l": 610.0, + "t": 454.33333333333337, + "r": 680.0, + "b": 475.0, "coord_origin": "TOPLEFT" }, - "confidence": 0.7627862095832825, + "confidence": 90.0, "cells": [ { - "index": 26, + "index": 1, "rgba": { "r": 0, "g": 0, @@ -3034,110 +2009,20 @@ "a": 255 }, "rect": { - "r_x0": 326.33333333333337, - "r_y0": 554.6666666666666, - "r_x1": 299.0, - "r_y1": 554.6666666666666, - "r_x2": 299.0, - "r_y2": 561.0, - "r_x3": 326.33333333333337, - "r_y3": 561.0, + "r_x0": 680.0, + "r_y0": 454.33333333333337, + "r_x1": 610.0, + "r_y1": 454.33333333333337, + "r_x2": 610.0, + "r_y2": 475.0, + "r_x3": 680.0, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "some", - "orig": "some", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 0.9569136, - "from_ocr": true - }, - { - "index": 27, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 295.33333333333337, - "r_y0": 554.6666666666666, - "r_x1": 279.0, - "r_y1": 554.6666666666666, - "r_x2": 279.0, - "r_y2": 563.3333333333334, - "r_x3": 295.33333333333337, - "r_y3": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "cell", - "orig": "cell", - "text_direction": "left_to_right", - "confidence": 0.9622145799999999, - "from_ocr": true - } - ], - "children": [] - }, - { - "id": 5, - "label": "text", - "bbox": { - "l": 149.0, - "t": 554.6666666666666, - "r": 213.66666666666666, - "b": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.7541249394416809, - "cells": [ - { - "index": 28, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 213.66666666666666, - "r_y0": 554.6666666666666, - "r_x1": 190.0, - "r_y1": 554.6666666666666, - "r_x2": 190.0, - "r_y2": 563.3333333333334, - "r_x3": 213.66666666666666, - "r_y3": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "have", - "orig": "have", - "text_direction": "left_to_right", - "confidence": 0.96403, - "from_ocr": true - }, - { - "index": 29, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 186.0, - "r_y0": 554.6666666666666, - "r_x1": 149.0, - "r_y1": 554.6666666666666, - "r_x2": 149.0, - "r_y2": 563.0, - "r_x3": 186.0, - "r_y3": 563.0, - "coord_origin": "TOPLEFT" - }, - "text": "content", - "orig": "content", - "text_direction": "left_to_right", - "confidence": 0.96691612, + "confidence": 90.0, "from_ocr": true } ], @@ -3147,16 +2032,16 @@ "id": 3, "label": "text", "bbox": { - "l": 371.6666666666667, - "t": 508.3333333333333, - "r": 451.6666666666667, - "b": 517.0, + "l": 623.3333333333334, + "t": 392.0, + "r": 670.3333333333334, + "b": 408.0, "coord_origin": "TOPLEFT" }, - "confidence": 0.7616423964500427, + "confidence": 96.0, "cells": [ { - "index": 30, + "index": 2, "rgba": { "r": 0, "g": 0, @@ -3164,24 +2049,39 @@ "a": 255 }, "rect": { - "r_x0": 451.6666666666667, - "r_y0": 508.3333333333333, - "r_x1": 422.6666666666667, - "r_y1": 508.3333333333333, - "r_x2": 422.6666666666667, - "r_y2": 517.0, - "r_x3": 451.6666666666667, - "r_y3": 517.0, + "r_x0": 670.3333333333334, + "r_y0": 392.0, + "r_x1": 623.3333333333334, + "r_y1": 392.0, + "r_x2": 623.3333333333334, + "r_y2": 408.0, + "r_x3": 670.3333333333334, + "r_y3": 408.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9684503200000001, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 4, + "label": "text", + "bbox": { + "l": 623.3333333333334, + "t": 312.0, + "r": 670.3333333333334, + "b": 328.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ { - "index": 31, + "index": 3, "rgba": { "r": 0, "g": 0, @@ -3189,24 +2089,39 @@ "a": 255 }, "rect": { - "r_x0": 419.0, - "r_y0": 508.3333333333333, - "r_x1": 393.0, - "r_y1": 508.3333333333333, - "r_x2": 393.0, - "r_y2": 516.6666666666666, - "r_x3": 419.0, - "r_y3": 516.6666666666666, + "r_x0": 670.3333333333334, + "r_y0": 312.0, + "r_x1": 623.3333333333334, + "r_y1": 312.0, + "r_x2": 623.3333333333334, + "r_y2": 328.0, + "r_x3": 670.3333333333334, + "r_y3": 328.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96073517, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 5, + "label": "text", + "bbox": { + "l": 428.3333333333333, + "t": 485.66666666666663, + "r": 559.6666666666667, + "b": 506.3333333333333, + "coord_origin": "TOPLEFT" + }, + "confidence": 92.0, + "cells": [ { - "index": 32, + "index": 4, "rgba": { "r": 0, "g": 0, @@ -3214,20 +2129,20 @@ "a": 255 }, "rect": { - "r_x0": 389.3333333333333, - "r_y0": 508.3333333333333, - "r_x1": 371.6666666666667, - "r_y1": 508.3333333333333, - "r_x2": 371.6666666666667, - "r_y2": 514.6666666666666, - "r_x3": 389.3333333333333, - "r_y3": 514.6666666666666, + "r_x0": 559.6666666666667, + "r_y0": 485.66666666666663, + "r_x1": 428.3333333333333, + "r_y1": 485.66666666666663, + "r_x2": 428.3333333333333, + "r_y2": 506.3333333333333, + "r_x3": 559.6666666666667, + "r_y3": 506.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 0.9615368700000001, + "confidence": 92.0, "from_ocr": true } ], @@ -3237,16 +2152,16 @@ "id": 6, "label": "text", "bbox": { - "l": 275.66666666666663, - "t": 508.3333333333333, - "r": 329.0, - "b": 517.0, + "l": 456.0, + "t": 459.0, + "r": 526.6666666666667, + "b": 475.0, "coord_origin": "TOPLEFT" }, - "confidence": 0.7468306422233582, + "confidence": 94.0, "cells": [ { - "index": 33, + "index": 5, "rgba": { "r": 0, "g": 0, @@ -3254,24 +2169,39 @@ "a": 255 }, "rect": { - "r_x0": 329.0, - "r_y0": 508.3333333333333, - "r_x1": 303.0, - "r_y1": 508.3333333333333, - "r_x2": 303.0, - "r_y2": 517.0, - "r_x3": 329.0, - "r_y3": 517.0, + "r_x0": 526.6666666666667, + "r_y0": 459.0, + "r_x1": 456.0, + "r_y1": 459.0, + "r_x2": 456.0, + "r_y2": 475.0, + "r_x3": 526.6666666666667, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9626261100000001, + "confidence": 94.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 7, + "label": "text", + "bbox": { + "l": 442.3333333333333, + "t": 408.0, + "r": 545.0, + "b": 424.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 91.0, + "cells": [ { - "index": 34, + "index": 6, "rgba": { "r": 0, "g": 0, @@ -3279,20 +2209,380 @@ "a": 255 }, "rect": { - "r_x0": 299.66666666666663, - "r_y0": 508.3333333333333, - "r_x1": 275.66666666666663, - "r_y1": 508.3333333333333, - "r_x2": 275.66666666666663, - "r_y2": 517.0, - "r_x3": 299.66666666666663, - "r_y3": 517.0, + "r_x0": 545.0, + "r_y0": 408.0, + "r_x1": 442.3333333333333, + "r_y1": 408.0, + "r_x2": 442.3333333333333, + "r_y2": 424.0, + "r_x3": 545.0, + "r_y3": 424.0, "coord_origin": "TOPLEFT" }, - "text": "don't", - "orig": "don't", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.96669136, + "confidence": 91.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 8, + "label": "text", + "bbox": { + "l": 468.0, + "t": 376.0, + "r": 515.0, + "b": 392.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ + { + "index": 7, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 515.0, + "r_y0": 376.0, + "r_x1": 468.0, + "r_y1": 376.0, + "r_x2": 468.0, + "r_y2": 392.0, + "r_x3": 515.0, + "r_y3": 392.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 9, + "label": "text", + "bbox": { + "l": 442.3333333333333, + "t": 328.0, + "r": 545.0, + "b": 344.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ + { + "index": 8, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 545.0, + "r_y0": 328.0, + "r_x1": 442.3333333333333, + "r_y1": 328.0, + "r_x2": 442.3333333333333, + "r_y2": 344.0, + "r_x3": 545.0, + "r_y3": 344.0, + "coord_origin": "TOPLEFT" + }, + "text": "Some other", + "orig": "Some other", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 10, + "label": "text", + "bbox": { + "l": 468.0, + "t": 296.6666666666667, + "r": 515.0, + "b": 312.6666666666667, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 9, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 515.0, + "r_y0": 296.6666666666667, + "r_x1": 468.0, + "r_y1": 296.6666666666667, + "r_x2": 468.0, + "r_y2": 312.6666666666667, + "r_x3": 515.0, + "r_y3": 312.6666666666667, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 11, + "label": "text", + "bbox": { + "l": 274.0, + "t": 490.33333333333337, + "r": 385.6666666666667, + "b": 506.3333333333333, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 10, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 385.6666666666667, + "r_y0": 490.33333333333337, + "r_x1": 274.0, + "r_y1": 490.33333333333337, + "r_x2": 274.0, + "r_y2": 506.3333333333333, + "r_x3": 385.6666666666667, + "r_y3": 506.3333333333333, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 12, + "label": "text", + "bbox": { + "l": 292.66666666666663, + "t": 459.0, + "r": 363.0, + "b": 475.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ + { + "index": 11, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 363.0, + "r_y0": 459.0, + "r_x1": 292.66666666666663, + "r_y1": 459.0, + "r_x2": 292.66666666666663, + "r_y2": 475.0, + "r_x3": 363.0, + "r_y3": 475.0, + "coord_origin": "TOPLEFT" + }, + "text": "column", + "orig": "column", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 13, + "label": "text", + "bbox": { + "l": 278.0, + "t": 408.0, + "r": 383.6666666666667, + "b": 424.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ + { + "index": 12, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 383.6666666666667, + "r_y0": 408.0, + "r_x1": 278.0, + "r_y1": 408.0, + "r_x2": 278.0, + "r_y2": 424.0, + "r_x3": 383.6666666666667, + "r_y3": 424.0, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 14, + "label": "text", + "bbox": { + "l": 304.33333333333337, + "t": 376.0, + "r": 351.33333333333337, + "b": 392.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 351.33333333333337, + "r_y0": 376.0, + "r_x1": 304.33333333333337, + "r_y1": 376.0, + "r_x2": 304.33333333333337, + "r_y2": 392.0, + "r_x3": 351.33333333333337, + "r_y3": 392.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 15, + "label": "text", + "bbox": { + "l": 278.0, + "t": 328.0, + "r": 383.6666666666667, + "b": 344.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 383.6666666666667, + "r_y0": 328.0, + "r_x1": 278.0, + "r_y1": 328.0, + "r_x2": 278.0, + "r_y2": 344.0, + "r_x3": 383.6666666666667, + "r_y3": 344.0, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 16, + "label": "text", + "bbox": { + "l": 304.33333333333337, + "t": 296.6666666666667, + "r": 351.33333333333337, + "b": 312.6666666666667, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 351.33333333333337, + "r_y0": 296.6666666666667, + "r_x1": 304.33333333333337, + "r_y1": 296.6666666666667, + "r_x2": 304.33333333333337, + "r_y2": 312.6666666666667, + "r_x3": 351.33333333333337, + "r_y3": 312.6666666666667, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, "from_ocr": true } ], @@ -3302,17 +2592,17 @@ }, "text": null, "otsl_seq": [ - "ecel", + "ched", "ched", "ched", "nl", - "rhed", + "fcel", "fcel", "fcel", "nl", - "rhed", "fcel", - "ecel", + "fcel", + "fcel", "nl" ], "num_rows": 3, @@ -3320,29 +2610,48 @@ "table_cells": [ { "bbox": { - "l": 308.0, - "t": 601.0, - "r": 337.0, - "b": 609.6666666666666, + "l": 97.33333333333337, + "t": 105.66666666666669, + "r": 190.0, + "b": 126.33333333333337, "coord_origin": "TOPLEFT" }, "row_span": 1, "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "Some column", + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 0, + "end_col_offset_idx": 1, + "text": "Vertically merged", + "column_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 121.66666666666663, + "t": 204.0, + "r": 168.66666666666663, + "b": 220.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 0, + "end_col_offset_idx": 1, + "text": "value", "column_header": false, "row_header": false, "row_section": false }, { "bbox": { - "l": 201.66666666666669, - "t": 601.0, - "r": 230.66666666666666, - "b": 609.6666666666666, + "l": 121.66666666666663, + "t": 284.0, + "r": 168.66666666666663, + "b": 300.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -3351,17 +2660,93 @@ "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, - "text": "Some other column", + "text": "value", "column_header": false, - "row_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 232.33333333333326, + "t": 105.66666666666669, + "r": 363.6666666666667, + "b": 126.33333333333337, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Other merged column", + "column_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 247.0, + "t": 188.0, + "r": 349.6666666666667, + "b": 204.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Some other value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 247.0, + "t": 268.0, + "r": 349.6666666666667, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 2, + "end_row_offset_idx": 3, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Some other value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 406.3333333333333, + "t": 105.66666666666669, + "r": 518.0, + "b": 121.66666666666663, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another column", + "column_header": true, + "row_header": false, "row_section": false }, { "bbox": { "l": 408.3333333333333, - "t": 554.6666666666666, - "r": 437.3333333333333, - "b": 563.3333333333334, + "t": 188.0, + "r": 514.0, + "b": 204.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -3370,84 +2755,27 @@ "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, - "text": "Some row", + "text": "Yet another value", "column_header": false, "row_header": false, "row_section": false }, { "bbox": { - "l": 299.0, - "t": 554.6666666666666, - "r": 326.33333333333337, - "b": 561.0, + "l": 408.3333333333333, + "t": 268.0, + "r": 514.0, + "b": 284.0, "coord_origin": "TOPLEFT" }, "row_span": 1, "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "some cell", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 190.0, - "t": 554.6666666666666, - "r": 213.66666666666666, - "b": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "have content", - "column_header": false, - "row_header": true, - "row_section": false - }, - { - "bbox": { - "l": 422.6666666666667, - "t": 508.3333333333333, - "r": 451.6666666666667, - "b": 517.0, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, + "start_row_offset_idx": 2, + "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, - "text": "Some other row", - "column_header": true, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 303.0, - "t": 508.3333333333333, - "r": 329.0, - "b": 517.0, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "other don't", - "column_header": true, + "text": "Yet another value", + "column_header": false, "row_header": false, "row_section": false } @@ -3462,20 +2790,20 @@ "assembled": { "elements": [ { - "label": "text", - "id": 8, + "label": "table", + "id": 0, "page_no": 0, "cluster": { - "id": 8, - "label": "text", + "id": 0, + "label": "table", "bbox": { - "l": 194.03979, - "t": 690.10254, - "r": 410.73657, - "b": 719.149414, + "l": 240.90093994140625, + "t": 277.41973876953125, + "r": 722.950309753418, + "b": 524.3504486083984, "coord_origin": "TOPLEFT" }, - "confidence": 0.7134009003639221, + "confidence": 0.9790865778923035, "cells": [ { "index": 0, @@ -3486,43 +2814,22 @@ "a": 255 }, "rect": { - "r_x0": 194.03979, - "r_y0": 719.149414, - "r_x1": 410.73657, - "r_y1": 719.149414, - "r_x2": 410.73657, - "r_y2": 690.10254, - "r_x3": 194.03979, - "r_y3": 690.10254, + "r_x0": 694.6666666666666, + "r_y0": 485.66666666666663, + "r_x1": 602.0, + "r_y1": 485.66666666666663, + "r_x2": 602.0, + "r_y2": 506.3333333333333, + "r_x3": 694.6666666666666, + "r_y3": 506.3333333333333, "coord_origin": "TOPLEFT" }, - "text": " tset elbat a si sihT", - "orig": " tset elbat a si sihT", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - } - ], - "children": [] - }, - "text": "tset elbat a si sihT" - }, - { - "label": "text", - "id": 0, - "page_no": 0, - "cluster": { - "id": 0, - "label": "text", - "bbox": { - "l": 238.78076, - "t": 655.42273, - "r": 540.0, - "b": 667.71179, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.8374139070510864, - "cells": [ + "confidence": 90.0, + "from_ocr": true + }, { "index": 1, "rgba": { @@ -3532,21 +2839,21 @@ "a": 255 }, "rect": { - "r_x0": 521.0545, - "r_y0": 667.71179, - "r_x1": 540.0, - "r_y1": 667.71179, - "r_x2": 540.0, - "r_y2": 655.42273, - "r_x3": 521.0545, - "r_y3": 655.42273, + "r_x0": 680.0, + "r_y0": 454.33333333333337, + "r_x1": 610.0, + "r_y1": 454.33333333333337, + "r_x2": 610.0, + "r_y2": 475.0, + "r_x3": 680.0, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "ehT", - "orig": "ehT", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true }, { "index": 2, @@ -3557,21 +2864,21 @@ "a": 255 }, "rect": { - "r_x0": 518.00269, - "r_y0": 667.71179, - "r_x1": 518.00488, - "r_y1": 667.71179, - "r_x2": 518.00488, - "r_y2": 655.42273, - "r_x3": 518.00269, - "r_y3": 655.42273, + "r_x0": 670.3333333333334, + "r_y0": 392.0, + "r_x1": 623.3333333333334, + "r_y1": 392.0, + "r_x2": 623.3333333333334, + "r_y2": 408.0, + "r_x3": 670.3333333333334, + "r_y3": 408.0, "coord_origin": "TOPLEFT" }, - "text": " t", - "orig": " t", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 3, @@ -3582,21 +2889,21 @@ "a": 255 }, "rect": { - "r_x0": 503.33759000000003, - "r_y0": 667.71179, - "r_x1": 514.95093, - "r_y1": 667.71179, - "r_x2": 514.95093, - "r_y2": 655.42273, - "r_x3": 503.33759000000003, - "r_y3": 655.42273, + "r_x0": 670.3333333333334, + "r_y0": 312.0, + "r_x1": 623.3333333333334, + "r_y1": 312.0, + "r_x2": 623.3333333333334, + "r_y2": 328.0, + "r_x3": 670.3333333333334, + "r_y3": 328.0, "coord_origin": "TOPLEFT" }, - "text": "se", - "orig": "se", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 4, @@ -3607,21 +2914,21 @@ "a": 255 }, "rect": { - "r_x0": 500.28534, - "r_y0": 667.71179, - "r_x1": 500.28751, - "r_y1": 667.71179, - "r_x2": 500.28751, - "r_y2": 655.42273, - "r_x3": 500.28534, - "r_y3": 655.42273, + "r_x0": 559.6666666666667, + "r_y0": 485.66666666666663, + "r_x1": 428.3333333333333, + "r_y1": 485.66666666666663, + "r_x2": 428.3333333333333, + "r_y2": 506.3333333333333, + "r_x3": 559.6666666666667, + "r_y3": 506.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "t ", - "orig": "t ", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 5, @@ -3632,21 +2939,21 @@ "a": 255 }, "rect": { - "r_x0": 459.36172000000005, - "r_y0": 667.71179, - "r_x1": 497.23352, - "r_y1": 667.71179, - "r_x2": 497.23352, - "r_y2": 655.42273, - "r_x3": 459.36172000000005, - "r_y3": 655.42273, + "r_x0": 526.6666666666667, + "r_y0": 459.0, + "r_x1": 456.0, + "r_y1": 459.0, + "r_x2": 456.0, + "r_y2": 475.0, + "r_x3": 526.6666666666667, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "w strats", - "orig": "w strats", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 6, @@ -3657,21 +2964,21 @@ "a": 255 }, "rect": { - "r_x0": 456.92352, - "r_y0": 667.71179, - "r_x1": 456.92526, - "r_y1": 667.71179, - "r_x2": 456.92526, - "r_y2": 655.42273, - "r_x3": 456.92352, - "r_y3": 655.42273, + "r_x0": 545.0, + "r_y0": 408.0, + "r_x1": 442.3333333333333, + "r_y1": 408.0, + "r_x2": 442.3333333333333, + "r_y2": 424.0, + "r_x3": 545.0, + "r_y3": 424.0, "coord_origin": "TOPLEFT" }, - "text": "it", - "orig": "it", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 91.0, + "from_ocr": true }, { "index": 7, @@ -3682,21 +2989,21 @@ "a": 255 }, "rect": { - "r_x0": 377.49374, - "r_y0": 667.71179, - "r_x1": 453.87128, - "r_y1": 667.71179, - "r_x2": 453.87128, - "r_y2": 655.42273, - "r_x3": 377.49374, - "r_y3": 655.42273, + "r_x0": 515.0, + "r_y0": 376.0, + "r_x1": 468.0, + "r_y1": 376.0, + "r_x2": 468.0, + "r_y2": 392.0, + "r_x3": 515.0, + "r_y3": 392.0, "coord_origin": "TOPLEFT" }, - "text": "modnar emos h", - "orig": "modnar emos h", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 8, @@ -3707,21 +3014,21 @@ "a": 255 }, "rect": { - "r_x0": 374.44409, - "r_y0": 667.71179, - "r_x1": 374.44629, - "r_y1": 667.71179, - "r_x2": 374.44629, - "r_y2": 655.42273, - "r_x3": 374.44409, - "r_y3": 655.42273, + "r_x0": 545.0, + "r_y0": 328.0, + "r_x1": 442.3333333333333, + "r_y1": 328.0, + "r_x2": 442.3333333333333, + "r_y2": 344.0, + "r_x3": 545.0, + "r_y3": 344.0, "coord_origin": "TOPLEFT" }, - "text": " t", - "orig": " t", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 9, @@ -3732,21 +3039,21 @@ "a": 255 }, "rect": { - "r_x0": 359.77896, - "r_y0": 667.71179, - "r_x1": 371.3923, - "r_y1": 667.71179, - "r_x2": 371.3923, - "r_y2": 655.42273, - "r_x3": 359.77896, - "r_y3": 655.42273, + "r_x0": 515.0, + "r_y0": 296.6666666666667, + "r_x1": 468.0, + "r_y1": 296.6666666666667, + "r_x2": 468.0, + "r_y2": 312.6666666666667, + "r_x3": 515.0, + "r_y3": 312.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "xe", - "orig": "xe", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 10, @@ -3757,21 +3064,21 @@ "a": 255 }, "rect": { - "r_x0": 356.72672, - "r_y0": 667.71179, - "r_x1": 356.72888, - "r_y1": 667.71179, - "r_x2": 356.72888, - "r_y2": 655.42273, - "r_x3": 356.72672, - "r_y3": 655.42273, + "r_x0": 385.6666666666667, + "r_y0": 490.33333333333337, + "r_x1": 274.0, + "r_y1": 490.33333333333337, + "r_x2": 274.0, + "r_y2": 506.3333333333333, + "r_x3": 385.6666666666667, + "r_y3": 506.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "t ", - "orig": "t ", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 11, @@ -3782,21 +3089,21 @@ "a": 255 }, "rect": { - "r_x0": 335.3306, - "r_y0": 667.71179, - "r_x1": 353.67493, - "r_y1": 667.71179, - "r_x2": 353.67493, - "r_y2": 655.42273, - "r_x3": 335.3306, - "r_y3": 655.42273, + "r_x0": 363.0, + "r_y0": 459.0, + "r_x1": 292.66666666666663, + "r_y1": 459.0, + "r_x2": 292.66666666666663, + "r_y2": 475.0, + "r_x3": 363.0, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "dna", - "orig": "dna", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 12, @@ -3807,21 +3114,21 @@ "a": 255 }, "rect": { - "r_x0": 332.27878, - "r_y0": 667.71179, - "r_x1": 332.28094, - "r_y1": 667.71179, - "r_x2": 332.28094, - "r_y2": 655.42273, - "r_x3": 332.27878, - "r_y3": 655.42273, + "r_x0": 383.6666666666667, + "r_y0": 408.0, + "r_x1": 278.0, + "r_y1": 408.0, + "r_x2": 278.0, + "r_y2": 424.0, + "r_x3": 383.6666666666667, + "r_y3": 424.0, "coord_origin": "TOPLEFT" }, - "text": " t", - "orig": " t", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 13, @@ -3832,21 +3139,21 @@ "a": 255 }, "rect": { - "r_x0": 301.7153, - "r_y0": 667.71179, - "r_x1": 329.22699, - "r_y1": 667.71179, - "r_x2": 329.22699, - "r_y2": 655.42273, - "r_x3": 301.7153, - "r_y3": 655.42273, + "r_x0": 351.33333333333337, + "r_y0": 376.0, + "r_x1": 304.33333333333337, + "r_y1": 376.0, + "r_x2": 304.33333333333337, + "r_y2": 392.0, + "r_x3": 351.33333333333337, + "r_y3": 392.0, "coord_origin": "TOPLEFT" }, - "text": "a neh", - "orig": "a neh", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 14, @@ -3857,21 +3164,21 @@ "a": 255 }, "rect": { - "r_x0": 298.66348, - "r_y0": 667.71179, - "r_x1": 298.66565, - "r_y1": 667.71179, - "r_x2": 298.66565, - "r_y2": 655.42273, - "r_x3": 298.66348, - "r_y3": 655.42273, + "r_x0": 383.6666666666667, + "r_y0": 328.0, + "r_x1": 278.0, + "r_y1": 328.0, + "r_x2": 278.0, + "r_y2": 344.0, + "r_x3": 383.6666666666667, + "r_y3": 344.0, "coord_origin": "TOPLEFT" }, - "text": " t", - "orig": " t", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 15, @@ -3882,599 +3189,38 @@ "a": 255 }, "rect": { - "r_x0": 274.82526, - "r_y0": 667.71179, - "r_x1": 295.61169, - "r_y1": 667.71179, - "r_x2": 295.61169, - "r_y2": 655.42273, - "r_x3": 274.82526, - "r_y3": 655.42273, + "r_x0": 351.33333333333337, + "r_y0": 296.6666666666667, + "r_x1": 304.33333333333337, + "r_y1": 296.6666666666667, + "r_x2": 304.33333333333337, + "r_y2": 312.6666666666667, + "r_x3": 351.33333333333337, + "r_y3": 312.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "elba", - "orig": "elba", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - }, - { - "index": 16, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 271.77344, - "r_y0": 667.71179, - "r_x1": 271.7756, - "r_y1": 667.71179, - "r_x2": 271.7756, - "r_y2": 655.42273, - "r_x3": 271.77344, - "r_y3": 655.42273, - "coord_origin": "TOPLEFT" - }, - "text": " i", - "orig": " i", - "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - }, - { - "index": 17, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 241.83258, - "r_y0": 667.71179, - "r_x1": 269.3335, - "r_y1": 667.71179, - "r_x2": 269.3335, - "r_y2": 655.42273, - "r_x3": 241.83258, - "r_y3": 655.42273, - "coord_origin": "TOPLEFT" - }, - "text": "egam", - "orig": "egam", - "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - }, - { - "index": 18, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 238.78076, - "r_y0": 667.71179, - "r_x1": 238.78296, - "r_y1": 667.71179, - "r_x2": 238.78296, - "r_y2": 655.42273, - "r_x3": 238.78076, - "r_y3": 655.42273, - "coord_origin": "TOPLEFT" - }, - "text": ": ", - "orig": ": ", - "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - } - ], - "children": [] - }, - "text": "ehT t se t w strats it modnar emos h t xe t dna t a neh t elba i egam :" - }, - { - "label": "table", - "id": 9, - "page_no": 0, - "cluster": { - "id": 9, - "label": "table", - "bbox": { - "l": 112.69406127929688, - "t": 489.72344970703125, - "r": 470.0718078613281, - "b": 628.2994995117188, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.6408323049545288, - "cells": [ - { - "index": 19, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 337.0, - "r_y0": 601.0, - "r_x1": 308.0, - "r_y1": 601.0, - "r_x2": 308.0, - "r_y2": 609.6666666666666, - "r_x3": 337.0, - "r_y3": 609.6666666666666, - "coord_origin": "TOPLEFT" - }, - "text": "Some", - "orig": "Some", - "text_direction": "left_to_right", - "confidence": 0.95841644, - "from_ocr": true - }, - { - "index": 20, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 304.0, - "r_y0": 601.0, - "r_x1": 268.33333333333337, - "r_y1": 601.0, - "r_x2": 268.33333333333337, - "r_y2": 609.3333333333334, - "r_x3": 304.0, - "r_y3": 609.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "column", - "orig": "column", - "text_direction": "left_to_right", - "confidence": 0.95624527, - "from_ocr": true - }, - { - "index": 21, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 230.66666666666666, - "r_y0": 601.0, - "r_x1": 201.66666666666669, - "r_y1": 601.0, - "r_x2": 201.66666666666669, - "r_y2": 609.6666666666666, - "r_x3": 230.66666666666666, - "r_y3": 609.6666666666666, - "coord_origin": "TOPLEFT" - }, - "text": "Some", - "orig": "Some", - "text_direction": "left_to_right", - "confidence": 0.96296555, - "from_ocr": true - }, - { - "index": 22, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 197.66666666666669, - "r_y0": 601.0, - "r_x1": 172.0, - "r_y1": 601.0, - "r_x2": 172.0, - "r_y2": 609.3333333333334, - "r_x3": 197.66666666666669, - "r_y3": 609.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.96467484, - "from_ocr": true - }, - { - "index": 23, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 168.66666666666669, - "r_y0": 601.0, - "r_x1": 133.0, - "r_y1": 601.0, - "r_x2": 133.0, - "r_y2": 609.3333333333334, - "r_x3": 168.66666666666669, - "r_y3": 609.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "column", - "orig": "column", - "text_direction": "left_to_right", - "confidence": 0.95497986, - "from_ocr": true - }, - { - "index": 24, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 437.3333333333333, - "r_y0": 554.6666666666666, - "r_x1": 408.3333333333333, - "r_y1": 554.6666666666666, - "r_x2": 408.3333333333333, - "r_y2": 563.3333333333334, - "r_x3": 437.3333333333333, - "r_y3": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "Some", - "orig": "Some", - "text_direction": "left_to_right", - "confidence": 0.95944489, - "from_ocr": true - }, - { - "index": 25, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 404.0, - "r_y0": 554.6666666666666, - "r_x1": 386.3333333333333, - "r_y1": 554.6666666666666, - "r_x2": 386.3333333333333, - "r_y2": 561.0, - "r_x3": 404.0, - "r_y3": 561.0, - "coord_origin": "TOPLEFT" - }, - "text": "row", - "orig": "row", - "text_direction": "left_to_right", - "confidence": 0.9680950199999999, - "from_ocr": true - }, - { - "index": 26, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 326.33333333333337, - "r_y0": 554.6666666666666, - "r_x1": 299.0, - "r_y1": 554.6666666666666, - "r_x2": 299.0, - "r_y2": 561.0, - "r_x3": 326.33333333333337, - "r_y3": 561.0, - "coord_origin": "TOPLEFT" - }, - "text": "some", - "orig": "some", - "text_direction": "left_to_right", - "confidence": 0.9569136, - "from_ocr": true - }, - { - "index": 27, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 295.33333333333337, - "r_y0": 554.6666666666666, - "r_x1": 279.0, - "r_y1": 554.6666666666666, - "r_x2": 279.0, - "r_y2": 563.3333333333334, - "r_x3": 295.33333333333337, - "r_y3": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "cell", - "orig": "cell", - "text_direction": "left_to_right", - "confidence": 0.9622145799999999, - "from_ocr": true - }, - { - "index": 28, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 213.66666666666666, - "r_y0": 554.6666666666666, - "r_x1": 190.0, - "r_y1": 554.6666666666666, - "r_x2": 190.0, - "r_y2": 563.3333333333334, - "r_x3": 213.66666666666666, - "r_y3": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "have", - "orig": "have", - "text_direction": "left_to_right", - "confidence": 0.96403, - "from_ocr": true - }, - { - "index": 29, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 186.0, - "r_y0": 554.6666666666666, - "r_x1": 149.0, - "r_y1": 554.6666666666666, - "r_x2": 149.0, - "r_y2": 563.0, - "r_x3": 186.0, - "r_y3": 563.0, - "coord_origin": "TOPLEFT" - }, - "text": "content", - "orig": "content", - "text_direction": "left_to_right", - "confidence": 0.96691612, - "from_ocr": true - }, - { - "index": 30, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 451.6666666666667, - "r_y0": 508.3333333333333, - "r_x1": 422.6666666666667, - "r_y1": 508.3333333333333, - "r_x2": 422.6666666666667, - "r_y2": 517.0, - "r_x3": 451.6666666666667, - "r_y3": 517.0, - "coord_origin": "TOPLEFT" - }, - "text": "Some", - "orig": "Some", - "text_direction": "left_to_right", - "confidence": 0.9684503200000001, - "from_ocr": true - }, - { - "index": 31, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 419.0, - "r_y0": 508.3333333333333, - "r_x1": 393.0, - "r_y1": 508.3333333333333, - "r_x2": 393.0, - "r_y2": 516.6666666666666, - "r_x3": 419.0, - "r_y3": 516.6666666666666, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.96073517, - "from_ocr": true - }, - { - "index": 32, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 389.3333333333333, - "r_y0": 508.3333333333333, - "r_x1": 371.6666666666667, - "r_y1": 508.3333333333333, - "r_x2": 371.6666666666667, - "r_y2": 514.6666666666666, - "r_x3": 389.3333333333333, - "r_y3": 514.6666666666666, - "coord_origin": "TOPLEFT" - }, - "text": "row", - "orig": "row", - "text_direction": "left_to_right", - "confidence": 0.9615368700000001, - "from_ocr": true - }, - { - "index": 33, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 329.0, - "r_y0": 508.3333333333333, - "r_x1": 303.0, - "r_y1": 508.3333333333333, - "r_x2": 303.0, - "r_y2": 517.0, - "r_x3": 329.0, - "r_y3": 517.0, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.9626261100000001, - "from_ocr": true - }, - { - "index": 34, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 299.66666666666663, - "r_y0": 508.3333333333333, - "r_x1": 275.66666666666663, - "r_y1": 508.3333333333333, - "r_x2": 275.66666666666663, - "r_y2": 517.0, - "r_x3": 299.66666666666663, - "r_y3": 517.0, - "coord_origin": "TOPLEFT" - }, - "text": "don't", - "orig": "don't", - "text_direction": "left_to_right", - "confidence": 0.96669136, + "confidence": 95.0, "from_ocr": true } ], "children": [ - { - "id": 7, - "label": "text", - "bbox": { - "l": 268.33333333333337, - "t": 601.0, - "r": 337.0, - "b": 609.6666666666666, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.7441245913505554, - "cells": [ - { - "index": 19, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 337.0, - "r_y0": 601.0, - "r_x1": 308.0, - "r_y1": 601.0, - "r_x2": 308.0, - "r_y2": 609.6666666666666, - "r_x3": 337.0, - "r_y3": 609.6666666666666, - "coord_origin": "TOPLEFT" - }, - "text": "Some", - "orig": "Some", - "text_direction": "left_to_right", - "confidence": 0.95841644, - "from_ocr": true - }, - { - "index": 20, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 304.0, - "r_y0": 601.0, - "r_x1": 268.33333333333337, - "r_y1": 601.0, - "r_x2": 268.33333333333337, - "r_y2": 609.3333333333334, - "r_x3": 304.0, - "r_y3": 609.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "column", - "orig": "column", - "text_direction": "left_to_right", - "confidence": 0.95624527, - "from_ocr": true - } - ], - "children": [] - }, { "id": 1, "label": "text", "bbox": { - "l": 133.0, - "t": 601.0, - "r": 230.66666666666666, - "b": 609.6666666666666, + "l": 602.0, + "t": 485.66666666666663, + "r": 694.6666666666666, + "b": 506.3333333333333, "coord_origin": "TOPLEFT" }, - "confidence": 0.7668525576591492, + "confidence": 90.0, "cells": [ { - "index": 21, + "index": 0, "rgba": { "r": 0, "g": 0, @@ -4482,135 +3228,20 @@ "a": 255 }, "rect": { - "r_x0": 230.66666666666666, - "r_y0": 601.0, - "r_x1": 201.66666666666669, - "r_y1": 601.0, - "r_x2": 201.66666666666669, - "r_y2": 609.6666666666666, - "r_x3": 230.66666666666666, - "r_y3": 609.6666666666666, + "r_x0": 694.6666666666666, + "r_y0": 485.66666666666663, + "r_x1": 602.0, + "r_y1": 485.66666666666663, + "r_x2": 602.0, + "r_y2": 506.3333333333333, + "r_x3": 694.6666666666666, + "r_y3": 506.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 0.96296555, - "from_ocr": true - }, - { - "index": 22, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 197.66666666666669, - "r_y0": 601.0, - "r_x1": 172.0, - "r_y1": 601.0, - "r_x2": 172.0, - "r_y2": 609.3333333333334, - "r_x3": 197.66666666666669, - "r_y3": 609.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.96467484, - "from_ocr": true - }, - { - "index": 23, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 168.66666666666669, - "r_y0": 601.0, - "r_x1": 133.0, - "r_y1": 601.0, - "r_x2": 133.0, - "r_y2": 609.3333333333334, - "r_x3": 168.66666666666669, - "r_y3": 609.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "column", - "orig": "column", - "text_direction": "left_to_right", - "confidence": 0.95497986, - "from_ocr": true - } - ], - "children": [] - }, - { - "id": 4, - "label": "text", - "bbox": { - "l": 386.3333333333333, - "t": 554.6666666666666, - "r": 437.3333333333333, - "b": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.7588309049606323, - "cells": [ - { - "index": 24, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 437.3333333333333, - "r_y0": 554.6666666666666, - "r_x1": 408.3333333333333, - "r_y1": 554.6666666666666, - "r_x2": 408.3333333333333, - "r_y2": 563.3333333333334, - "r_x3": 437.3333333333333, - "r_y3": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "Some", - "orig": "Some", - "text_direction": "left_to_right", - "confidence": 0.95944489, - "from_ocr": true - }, - { - "index": 25, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 404.0, - "r_y0": 554.6666666666666, - "r_x1": 386.3333333333333, - "r_y1": 554.6666666666666, - "r_x2": 386.3333333333333, - "r_y2": 561.0, - "r_x3": 404.0, - "r_y3": 561.0, - "coord_origin": "TOPLEFT" - }, - "text": "row", - "orig": "row", - "text_direction": "left_to_right", - "confidence": 0.9680950199999999, + "confidence": 90.0, "from_ocr": true } ], @@ -4620,16 +3251,16 @@ "id": 2, "label": "text", "bbox": { - "l": 279.0, - "t": 554.6666666666666, - "r": 326.33333333333337, - "b": 563.3333333333334, + "l": 610.0, + "t": 454.33333333333337, + "r": 680.0, + "b": 475.0, "coord_origin": "TOPLEFT" }, - "confidence": 0.7627862095832825, + "confidence": 90.0, "cells": [ { - "index": 26, + "index": 1, "rgba": { "r": 0, "g": 0, @@ -4637,110 +3268,20 @@ "a": 255 }, "rect": { - "r_x0": 326.33333333333337, - "r_y0": 554.6666666666666, - "r_x1": 299.0, - "r_y1": 554.6666666666666, - "r_x2": 299.0, - "r_y2": 561.0, - "r_x3": 326.33333333333337, - "r_y3": 561.0, + "r_x0": 680.0, + "r_y0": 454.33333333333337, + "r_x1": 610.0, + "r_y1": 454.33333333333337, + "r_x2": 610.0, + "r_y2": 475.0, + "r_x3": 680.0, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "some", - "orig": "some", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 0.9569136, - "from_ocr": true - }, - { - "index": 27, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 295.33333333333337, - "r_y0": 554.6666666666666, - "r_x1": 279.0, - "r_y1": 554.6666666666666, - "r_x2": 279.0, - "r_y2": 563.3333333333334, - "r_x3": 295.33333333333337, - "r_y3": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "cell", - "orig": "cell", - "text_direction": "left_to_right", - "confidence": 0.9622145799999999, - "from_ocr": true - } - ], - "children": [] - }, - { - "id": 5, - "label": "text", - "bbox": { - "l": 149.0, - "t": 554.6666666666666, - "r": 213.66666666666666, - "b": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.7541249394416809, - "cells": [ - { - "index": 28, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 213.66666666666666, - "r_y0": 554.6666666666666, - "r_x1": 190.0, - "r_y1": 554.6666666666666, - "r_x2": 190.0, - "r_y2": 563.3333333333334, - "r_x3": 213.66666666666666, - "r_y3": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "have", - "orig": "have", - "text_direction": "left_to_right", - "confidence": 0.96403, - "from_ocr": true - }, - { - "index": 29, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 186.0, - "r_y0": 554.6666666666666, - "r_x1": 149.0, - "r_y1": 554.6666666666666, - "r_x2": 149.0, - "r_y2": 563.0, - "r_x3": 186.0, - "r_y3": 563.0, - "coord_origin": "TOPLEFT" - }, - "text": "content", - "orig": "content", - "text_direction": "left_to_right", - "confidence": 0.96691612, + "confidence": 90.0, "from_ocr": true } ], @@ -4750,16 +3291,16 @@ "id": 3, "label": "text", "bbox": { - "l": 371.6666666666667, - "t": 508.3333333333333, - "r": 451.6666666666667, - "b": 517.0, + "l": 623.3333333333334, + "t": 392.0, + "r": 670.3333333333334, + "b": 408.0, "coord_origin": "TOPLEFT" }, - "confidence": 0.7616423964500427, + "confidence": 96.0, "cells": [ { - "index": 30, + "index": 2, "rgba": { "r": 0, "g": 0, @@ -4767,24 +3308,39 @@ "a": 255 }, "rect": { - "r_x0": 451.6666666666667, - "r_y0": 508.3333333333333, - "r_x1": 422.6666666666667, - "r_y1": 508.3333333333333, - "r_x2": 422.6666666666667, - "r_y2": 517.0, - "r_x3": 451.6666666666667, - "r_y3": 517.0, + "r_x0": 670.3333333333334, + "r_y0": 392.0, + "r_x1": 623.3333333333334, + "r_y1": 392.0, + "r_x2": 623.3333333333334, + "r_y2": 408.0, + "r_x3": 670.3333333333334, + "r_y3": 408.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9684503200000001, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 4, + "label": "text", + "bbox": { + "l": 623.3333333333334, + "t": 312.0, + "r": 670.3333333333334, + "b": 328.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ { - "index": 31, + "index": 3, "rgba": { "r": 0, "g": 0, @@ -4792,24 +3348,39 @@ "a": 255 }, "rect": { - "r_x0": 419.0, - "r_y0": 508.3333333333333, - "r_x1": 393.0, - "r_y1": 508.3333333333333, - "r_x2": 393.0, - "r_y2": 516.6666666666666, - "r_x3": 419.0, - "r_y3": 516.6666666666666, + "r_x0": 670.3333333333334, + "r_y0": 312.0, + "r_x1": 623.3333333333334, + "r_y1": 312.0, + "r_x2": 623.3333333333334, + "r_y2": 328.0, + "r_x3": 670.3333333333334, + "r_y3": 328.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96073517, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 5, + "label": "text", + "bbox": { + "l": 428.3333333333333, + "t": 485.66666666666663, + "r": 559.6666666666667, + "b": 506.3333333333333, + "coord_origin": "TOPLEFT" + }, + "confidence": 92.0, + "cells": [ { - "index": 32, + "index": 4, "rgba": { "r": 0, "g": 0, @@ -4817,20 +3388,20 @@ "a": 255 }, "rect": { - "r_x0": 389.3333333333333, - "r_y0": 508.3333333333333, - "r_x1": 371.6666666666667, - "r_y1": 508.3333333333333, - "r_x2": 371.6666666666667, - "r_y2": 514.6666666666666, - "r_x3": 389.3333333333333, - "r_y3": 514.6666666666666, + "r_x0": 559.6666666666667, + "r_y0": 485.66666666666663, + "r_x1": 428.3333333333333, + "r_y1": 485.66666666666663, + "r_x2": 428.3333333333333, + "r_y2": 506.3333333333333, + "r_x3": 559.6666666666667, + "r_y3": 506.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 0.9615368700000001, + "confidence": 92.0, "from_ocr": true } ], @@ -4840,16 +3411,16 @@ "id": 6, "label": "text", "bbox": { - "l": 275.66666666666663, - "t": 508.3333333333333, - "r": 329.0, - "b": 517.0, + "l": 456.0, + "t": 459.0, + "r": 526.6666666666667, + "b": 475.0, "coord_origin": "TOPLEFT" }, - "confidence": 0.7468306422233582, + "confidence": 94.0, "cells": [ { - "index": 33, + "index": 5, "rgba": { "r": 0, "g": 0, @@ -4857,24 +3428,39 @@ "a": 255 }, "rect": { - "r_x0": 329.0, - "r_y0": 508.3333333333333, - "r_x1": 303.0, - "r_y1": 508.3333333333333, - "r_x2": 303.0, - "r_y2": 517.0, - "r_x3": 329.0, - "r_y3": 517.0, + "r_x0": 526.6666666666667, + "r_y0": 459.0, + "r_x1": 456.0, + "r_y1": 459.0, + "r_x2": 456.0, + "r_y2": 475.0, + "r_x3": 526.6666666666667, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9626261100000001, + "confidence": 94.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 7, + "label": "text", + "bbox": { + "l": 442.3333333333333, + "t": 408.0, + "r": 545.0, + "b": 424.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 91.0, + "cells": [ { - "index": 34, + "index": 6, "rgba": { "r": 0, "g": 0, @@ -4882,20 +3468,380 @@ "a": 255 }, "rect": { - "r_x0": 299.66666666666663, - "r_y0": 508.3333333333333, - "r_x1": 275.66666666666663, - "r_y1": 508.3333333333333, - "r_x2": 275.66666666666663, - "r_y2": 517.0, - "r_x3": 299.66666666666663, - "r_y3": 517.0, + "r_x0": 545.0, + "r_y0": 408.0, + "r_x1": 442.3333333333333, + "r_y1": 408.0, + "r_x2": 442.3333333333333, + "r_y2": 424.0, + "r_x3": 545.0, + "r_y3": 424.0, "coord_origin": "TOPLEFT" }, - "text": "don't", - "orig": "don't", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.96669136, + "confidence": 91.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 8, + "label": "text", + "bbox": { + "l": 468.0, + "t": 376.0, + "r": 515.0, + "b": 392.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ + { + "index": 7, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 515.0, + "r_y0": 376.0, + "r_x1": 468.0, + "r_y1": 376.0, + "r_x2": 468.0, + "r_y2": 392.0, + "r_x3": 515.0, + "r_y3": 392.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 9, + "label": "text", + "bbox": { + "l": 442.3333333333333, + "t": 328.0, + "r": 545.0, + "b": 344.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ + { + "index": 8, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 545.0, + "r_y0": 328.0, + "r_x1": 442.3333333333333, + "r_y1": 328.0, + "r_x2": 442.3333333333333, + "r_y2": 344.0, + "r_x3": 545.0, + "r_y3": 344.0, + "coord_origin": "TOPLEFT" + }, + "text": "Some other", + "orig": "Some other", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 10, + "label": "text", + "bbox": { + "l": 468.0, + "t": 296.6666666666667, + "r": 515.0, + "b": 312.6666666666667, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 9, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 515.0, + "r_y0": 296.6666666666667, + "r_x1": 468.0, + "r_y1": 296.6666666666667, + "r_x2": 468.0, + "r_y2": 312.6666666666667, + "r_x3": 515.0, + "r_y3": 312.6666666666667, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 11, + "label": "text", + "bbox": { + "l": 274.0, + "t": 490.33333333333337, + "r": 385.6666666666667, + "b": 506.3333333333333, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 10, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 385.6666666666667, + "r_y0": 490.33333333333337, + "r_x1": 274.0, + "r_y1": 490.33333333333337, + "r_x2": 274.0, + "r_y2": 506.3333333333333, + "r_x3": 385.6666666666667, + "r_y3": 506.3333333333333, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 12, + "label": "text", + "bbox": { + "l": 292.66666666666663, + "t": 459.0, + "r": 363.0, + "b": 475.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ + { + "index": 11, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 363.0, + "r_y0": 459.0, + "r_x1": 292.66666666666663, + "r_y1": 459.0, + "r_x2": 292.66666666666663, + "r_y2": 475.0, + "r_x3": 363.0, + "r_y3": 475.0, + "coord_origin": "TOPLEFT" + }, + "text": "column", + "orig": "column", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 13, + "label": "text", + "bbox": { + "l": 278.0, + "t": 408.0, + "r": 383.6666666666667, + "b": 424.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ + { + "index": 12, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 383.6666666666667, + "r_y0": 408.0, + "r_x1": 278.0, + "r_y1": 408.0, + "r_x2": 278.0, + "r_y2": 424.0, + "r_x3": 383.6666666666667, + "r_y3": 424.0, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 14, + "label": "text", + "bbox": { + "l": 304.33333333333337, + "t": 376.0, + "r": 351.33333333333337, + "b": 392.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 351.33333333333337, + "r_y0": 376.0, + "r_x1": 304.33333333333337, + "r_y1": 376.0, + "r_x2": 304.33333333333337, + "r_y2": 392.0, + "r_x3": 351.33333333333337, + "r_y3": 392.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 15, + "label": "text", + "bbox": { + "l": 278.0, + "t": 328.0, + "r": 383.6666666666667, + "b": 344.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 383.6666666666667, + "r_y0": 328.0, + "r_x1": 278.0, + "r_y1": 328.0, + "r_x2": 278.0, + "r_y2": 344.0, + "r_x3": 383.6666666666667, + "r_y3": 344.0, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 16, + "label": "text", + "bbox": { + "l": 304.33333333333337, + "t": 296.6666666666667, + "r": 351.33333333333337, + "b": 312.6666666666667, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 351.33333333333337, + "r_y0": 296.6666666666667, + "r_x1": 304.33333333333337, + "r_y1": 296.6666666666667, + "r_x2": 304.33333333333337, + "r_y2": 312.6666666666667, + "r_x3": 351.33333333333337, + "r_y3": 312.6666666666667, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, "from_ocr": true } ], @@ -4905,17 +3851,17 @@ }, "text": null, "otsl_seq": [ - "ecel", + "ched", "ched", "ched", "nl", - "rhed", + "fcel", "fcel", "fcel", "nl", - "rhed", "fcel", - "ecel", + "fcel", + "fcel", "nl" ], "num_rows": 3, @@ -4923,29 +3869,48 @@ "table_cells": [ { "bbox": { - "l": 308.0, - "t": 601.0, - "r": 337.0, - "b": 609.6666666666666, + "l": 97.33333333333337, + "t": 105.66666666666669, + "r": 190.0, + "b": 126.33333333333337, "coord_origin": "TOPLEFT" }, "row_span": 1, "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "Some column", + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 0, + "end_col_offset_idx": 1, + "text": "Vertically merged", + "column_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 121.66666666666663, + "t": 204.0, + "r": 168.66666666666663, + "b": 220.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 0, + "end_col_offset_idx": 1, + "text": "value", "column_header": false, "row_header": false, "row_section": false }, { "bbox": { - "l": 201.66666666666669, - "t": 601.0, - "r": 230.66666666666666, - "b": 609.6666666666666, + "l": 121.66666666666663, + "t": 284.0, + "r": 168.66666666666663, + "b": 300.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -4954,17 +3919,93 @@ "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, - "text": "Some other column", + "text": "value", "column_header": false, - "row_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 232.33333333333326, + "t": 105.66666666666669, + "r": 363.6666666666667, + "b": 126.33333333333337, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Other merged column", + "column_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 247.0, + "t": 188.0, + "r": 349.6666666666667, + "b": 204.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Some other value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 247.0, + "t": 268.0, + "r": 349.6666666666667, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 2, + "end_row_offset_idx": 3, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Some other value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 406.3333333333333, + "t": 105.66666666666669, + "r": 518.0, + "b": 121.66666666666663, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another column", + "column_header": true, + "row_header": false, "row_section": false }, { "bbox": { "l": 408.3333333333333, - "t": 554.6666666666666, - "r": 437.3333333333333, - "b": 563.3333333333334, + "t": 188.0, + "r": 514.0, + "b": 204.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -4973,84 +4014,27 @@ "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, - "text": "Some row", + "text": "Yet another value", "column_header": false, "row_header": false, "row_section": false }, { "bbox": { - "l": 299.0, - "t": 554.6666666666666, - "r": 326.33333333333337, - "b": 561.0, + "l": 408.3333333333333, + "t": 268.0, + "r": 514.0, + "b": 284.0, "coord_origin": "TOPLEFT" }, "row_span": 1, "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "some cell", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 190.0, - "t": 554.6666666666666, - "r": 213.66666666666666, - "b": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "have content", - "column_header": false, - "row_header": true, - "row_section": false - }, - { - "bbox": { - "l": 422.6666666666667, - "t": 508.3333333333333, - "r": 451.6666666666667, - "b": 517.0, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, + "start_row_offset_idx": 2, + "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, - "text": "Some other row", - "column_header": true, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 303.0, - "t": 508.3333333333333, - "r": 329.0, - "b": 517.0, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "other don't", - "column_header": true, + "text": "Yet another value", + "column_header": false, "row_header": false, "row_section": false } @@ -5059,20 +4043,20 @@ ], "body": [ { - "label": "text", - "id": 8, + "label": "table", + "id": 0, "page_no": 0, "cluster": { - "id": 8, - "label": "text", + "id": 0, + "label": "table", "bbox": { - "l": 194.03979, - "t": 690.10254, - "r": 410.73657, - "b": 719.149414, + "l": 240.90093994140625, + "t": 277.41973876953125, + "r": 722.950309753418, + "b": 524.3504486083984, "coord_origin": "TOPLEFT" }, - "confidence": 0.7134009003639221, + "confidence": 0.9790865778923035, "cells": [ { "index": 0, @@ -5083,43 +4067,22 @@ "a": 255 }, "rect": { - "r_x0": 194.03979, - "r_y0": 719.149414, - "r_x1": 410.73657, - "r_y1": 719.149414, - "r_x2": 410.73657, - "r_y2": 690.10254, - "r_x3": 194.03979, - "r_y3": 690.10254, + "r_x0": 694.6666666666666, + "r_y0": 485.66666666666663, + "r_x1": 602.0, + "r_y1": 485.66666666666663, + "r_x2": 602.0, + "r_y2": 506.3333333333333, + "r_x3": 694.6666666666666, + "r_y3": 506.3333333333333, "coord_origin": "TOPLEFT" }, - "text": " tset elbat a si sihT", - "orig": " tset elbat a si sihT", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - } - ], - "children": [] - }, - "text": "tset elbat a si sihT" - }, - { - "label": "text", - "id": 0, - "page_no": 0, - "cluster": { - "id": 0, - "label": "text", - "bbox": { - "l": 238.78076, - "t": 655.42273, - "r": 540.0, - "b": 667.71179, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.8374139070510864, - "cells": [ + "confidence": 90.0, + "from_ocr": true + }, { "index": 1, "rgba": { @@ -5129,21 +4092,21 @@ "a": 255 }, "rect": { - "r_x0": 521.0545, - "r_y0": 667.71179, - "r_x1": 540.0, - "r_y1": 667.71179, - "r_x2": 540.0, - "r_y2": 655.42273, - "r_x3": 521.0545, - "r_y3": 655.42273, + "r_x0": 680.0, + "r_y0": 454.33333333333337, + "r_x1": 610.0, + "r_y1": 454.33333333333337, + "r_x2": 610.0, + "r_y2": 475.0, + "r_x3": 680.0, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "ehT", - "orig": "ehT", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true }, { "index": 2, @@ -5154,21 +4117,21 @@ "a": 255 }, "rect": { - "r_x0": 518.00269, - "r_y0": 667.71179, - "r_x1": 518.00488, - "r_y1": 667.71179, - "r_x2": 518.00488, - "r_y2": 655.42273, - "r_x3": 518.00269, - "r_y3": 655.42273, + "r_x0": 670.3333333333334, + "r_y0": 392.0, + "r_x1": 623.3333333333334, + "r_y1": 392.0, + "r_x2": 623.3333333333334, + "r_y2": 408.0, + "r_x3": 670.3333333333334, + "r_y3": 408.0, "coord_origin": "TOPLEFT" }, - "text": " t", - "orig": " t", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 3, @@ -5179,21 +4142,21 @@ "a": 255 }, "rect": { - "r_x0": 503.33759000000003, - "r_y0": 667.71179, - "r_x1": 514.95093, - "r_y1": 667.71179, - "r_x2": 514.95093, - "r_y2": 655.42273, - "r_x3": 503.33759000000003, - "r_y3": 655.42273, + "r_x0": 670.3333333333334, + "r_y0": 312.0, + "r_x1": 623.3333333333334, + "r_y1": 312.0, + "r_x2": 623.3333333333334, + "r_y2": 328.0, + "r_x3": 670.3333333333334, + "r_y3": 328.0, "coord_origin": "TOPLEFT" }, - "text": "se", - "orig": "se", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 4, @@ -5204,21 +4167,21 @@ "a": 255 }, "rect": { - "r_x0": 500.28534, - "r_y0": 667.71179, - "r_x1": 500.28751, - "r_y1": 667.71179, - "r_x2": 500.28751, - "r_y2": 655.42273, - "r_x3": 500.28534, - "r_y3": 655.42273, + "r_x0": 559.6666666666667, + "r_y0": 485.66666666666663, + "r_x1": 428.3333333333333, + "r_y1": 485.66666666666663, + "r_x2": 428.3333333333333, + "r_y2": 506.3333333333333, + "r_x3": 559.6666666666667, + "r_y3": 506.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "t ", - "orig": "t ", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 5, @@ -5229,21 +4192,21 @@ "a": 255 }, "rect": { - "r_x0": 459.36172000000005, - "r_y0": 667.71179, - "r_x1": 497.23352, - "r_y1": 667.71179, - "r_x2": 497.23352, - "r_y2": 655.42273, - "r_x3": 459.36172000000005, - "r_y3": 655.42273, + "r_x0": 526.6666666666667, + "r_y0": 459.0, + "r_x1": 456.0, + "r_y1": 459.0, + "r_x2": 456.0, + "r_y2": 475.0, + "r_x3": 526.6666666666667, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "w strats", - "orig": "w strats", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 6, @@ -5254,21 +4217,21 @@ "a": 255 }, "rect": { - "r_x0": 456.92352, - "r_y0": 667.71179, - "r_x1": 456.92526, - "r_y1": 667.71179, - "r_x2": 456.92526, - "r_y2": 655.42273, - "r_x3": 456.92352, - "r_y3": 655.42273, + "r_x0": 545.0, + "r_y0": 408.0, + "r_x1": 442.3333333333333, + "r_y1": 408.0, + "r_x2": 442.3333333333333, + "r_y2": 424.0, + "r_x3": 545.0, + "r_y3": 424.0, "coord_origin": "TOPLEFT" }, - "text": "it", - "orig": "it", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 91.0, + "from_ocr": true }, { "index": 7, @@ -5279,21 +4242,21 @@ "a": 255 }, "rect": { - "r_x0": 377.49374, - "r_y0": 667.71179, - "r_x1": 453.87128, - "r_y1": 667.71179, - "r_x2": 453.87128, - "r_y2": 655.42273, - "r_x3": 377.49374, - "r_y3": 655.42273, + "r_x0": 515.0, + "r_y0": 376.0, + "r_x1": 468.0, + "r_y1": 376.0, + "r_x2": 468.0, + "r_y2": 392.0, + "r_x3": 515.0, + "r_y3": 392.0, "coord_origin": "TOPLEFT" }, - "text": "modnar emos h", - "orig": "modnar emos h", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 8, @@ -5304,21 +4267,21 @@ "a": 255 }, "rect": { - "r_x0": 374.44409, - "r_y0": 667.71179, - "r_x1": 374.44629, - "r_y1": 667.71179, - "r_x2": 374.44629, - "r_y2": 655.42273, - "r_x3": 374.44409, - "r_y3": 655.42273, + "r_x0": 545.0, + "r_y0": 328.0, + "r_x1": 442.3333333333333, + "r_y1": 328.0, + "r_x2": 442.3333333333333, + "r_y2": 344.0, + "r_x3": 545.0, + "r_y3": 344.0, "coord_origin": "TOPLEFT" }, - "text": " t", - "orig": " t", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 9, @@ -5329,21 +4292,21 @@ "a": 255 }, "rect": { - "r_x0": 359.77896, - "r_y0": 667.71179, - "r_x1": 371.3923, - "r_y1": 667.71179, - "r_x2": 371.3923, - "r_y2": 655.42273, - "r_x3": 359.77896, - "r_y3": 655.42273, + "r_x0": 515.0, + "r_y0": 296.6666666666667, + "r_x1": 468.0, + "r_y1": 296.6666666666667, + "r_x2": 468.0, + "r_y2": 312.6666666666667, + "r_x3": 515.0, + "r_y3": 312.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "xe", - "orig": "xe", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 10, @@ -5354,21 +4317,21 @@ "a": 255 }, "rect": { - "r_x0": 356.72672, - "r_y0": 667.71179, - "r_x1": 356.72888, - "r_y1": 667.71179, - "r_x2": 356.72888, - "r_y2": 655.42273, - "r_x3": 356.72672, - "r_y3": 655.42273, + "r_x0": 385.6666666666667, + "r_y0": 490.33333333333337, + "r_x1": 274.0, + "r_y1": 490.33333333333337, + "r_x2": 274.0, + "r_y2": 506.3333333333333, + "r_x3": 385.6666666666667, + "r_y3": 506.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "t ", - "orig": "t ", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 11, @@ -5379,21 +4342,21 @@ "a": 255 }, "rect": { - "r_x0": 335.3306, - "r_y0": 667.71179, - "r_x1": 353.67493, - "r_y1": 667.71179, - "r_x2": 353.67493, - "r_y2": 655.42273, - "r_x3": 335.3306, - "r_y3": 655.42273, + "r_x0": 363.0, + "r_y0": 459.0, + "r_x1": 292.66666666666663, + "r_y1": 459.0, + "r_x2": 292.66666666666663, + "r_y2": 475.0, + "r_x3": 363.0, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "dna", - "orig": "dna", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 12, @@ -5404,21 +4367,21 @@ "a": 255 }, "rect": { - "r_x0": 332.27878, - "r_y0": 667.71179, - "r_x1": 332.28094, - "r_y1": 667.71179, - "r_x2": 332.28094, - "r_y2": 655.42273, - "r_x3": 332.27878, - "r_y3": 655.42273, + "r_x0": 383.6666666666667, + "r_y0": 408.0, + "r_x1": 278.0, + "r_y1": 408.0, + "r_x2": 278.0, + "r_y2": 424.0, + "r_x3": 383.6666666666667, + "r_y3": 424.0, "coord_origin": "TOPLEFT" }, - "text": " t", - "orig": " t", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 13, @@ -5429,21 +4392,21 @@ "a": 255 }, "rect": { - "r_x0": 301.7153, - "r_y0": 667.71179, - "r_x1": 329.22699, - "r_y1": 667.71179, - "r_x2": 329.22699, - "r_y2": 655.42273, - "r_x3": 301.7153, - "r_y3": 655.42273, + "r_x0": 351.33333333333337, + "r_y0": 376.0, + "r_x1": 304.33333333333337, + "r_y1": 376.0, + "r_x2": 304.33333333333337, + "r_y2": 392.0, + "r_x3": 351.33333333333337, + "r_y3": 392.0, "coord_origin": "TOPLEFT" }, - "text": "a neh", - "orig": "a neh", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 14, @@ -5454,21 +4417,21 @@ "a": 255 }, "rect": { - "r_x0": 298.66348, - "r_y0": 667.71179, - "r_x1": 298.66565, - "r_y1": 667.71179, - "r_x2": 298.66565, - "r_y2": 655.42273, - "r_x3": 298.66348, - "r_y3": 655.42273, + "r_x0": 383.6666666666667, + "r_y0": 328.0, + "r_x1": 278.0, + "r_y1": 328.0, + "r_x2": 278.0, + "r_y2": 344.0, + "r_x3": 383.6666666666667, + "r_y3": 344.0, "coord_origin": "TOPLEFT" }, - "text": " t", - "orig": " t", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 15, @@ -5479,599 +4442,38 @@ "a": 255 }, "rect": { - "r_x0": 274.82526, - "r_y0": 667.71179, - "r_x1": 295.61169, - "r_y1": 667.71179, - "r_x2": 295.61169, - "r_y2": 655.42273, - "r_x3": 274.82526, - "r_y3": 655.42273, + "r_x0": 351.33333333333337, + "r_y0": 296.6666666666667, + "r_x1": 304.33333333333337, + "r_y1": 296.6666666666667, + "r_x2": 304.33333333333337, + "r_y2": 312.6666666666667, + "r_x3": 351.33333333333337, + "r_y3": 312.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "elba", - "orig": "elba", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - }, - { - "index": 16, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 271.77344, - "r_y0": 667.71179, - "r_x1": 271.7756, - "r_y1": 667.71179, - "r_x2": 271.7756, - "r_y2": 655.42273, - "r_x3": 271.77344, - "r_y3": 655.42273, - "coord_origin": "TOPLEFT" - }, - "text": " i", - "orig": " i", - "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - }, - { - "index": 17, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 241.83258, - "r_y0": 667.71179, - "r_x1": 269.3335, - "r_y1": 667.71179, - "r_x2": 269.3335, - "r_y2": 655.42273, - "r_x3": 241.83258, - "r_y3": 655.42273, - "coord_origin": "TOPLEFT" - }, - "text": "egam", - "orig": "egam", - "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - }, - { - "index": 18, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 238.78076, - "r_y0": 667.71179, - "r_x1": 238.78296, - "r_y1": 667.71179, - "r_x2": 238.78296, - "r_y2": 655.42273, - "r_x3": 238.78076, - "r_y3": 655.42273, - "coord_origin": "TOPLEFT" - }, - "text": ": ", - "orig": ": ", - "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - } - ], - "children": [] - }, - "text": "ehT t se t w strats it modnar emos h t xe t dna t a neh t elba i egam :" - }, - { - "label": "table", - "id": 9, - "page_no": 0, - "cluster": { - "id": 9, - "label": "table", - "bbox": { - "l": 112.69406127929688, - "t": 489.72344970703125, - "r": 470.0718078613281, - "b": 628.2994995117188, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.6408323049545288, - "cells": [ - { - "index": 19, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 337.0, - "r_y0": 601.0, - "r_x1": 308.0, - "r_y1": 601.0, - "r_x2": 308.0, - "r_y2": 609.6666666666666, - "r_x3": 337.0, - "r_y3": 609.6666666666666, - "coord_origin": "TOPLEFT" - }, - "text": "Some", - "orig": "Some", - "text_direction": "left_to_right", - "confidence": 0.95841644, - "from_ocr": true - }, - { - "index": 20, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 304.0, - "r_y0": 601.0, - "r_x1": 268.33333333333337, - "r_y1": 601.0, - "r_x2": 268.33333333333337, - "r_y2": 609.3333333333334, - "r_x3": 304.0, - "r_y3": 609.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "column", - "orig": "column", - "text_direction": "left_to_right", - "confidence": 0.95624527, - "from_ocr": true - }, - { - "index": 21, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 230.66666666666666, - "r_y0": 601.0, - "r_x1": 201.66666666666669, - "r_y1": 601.0, - "r_x2": 201.66666666666669, - "r_y2": 609.6666666666666, - "r_x3": 230.66666666666666, - "r_y3": 609.6666666666666, - "coord_origin": "TOPLEFT" - }, - "text": "Some", - "orig": "Some", - "text_direction": "left_to_right", - "confidence": 0.96296555, - "from_ocr": true - }, - { - "index": 22, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 197.66666666666669, - "r_y0": 601.0, - "r_x1": 172.0, - "r_y1": 601.0, - "r_x2": 172.0, - "r_y2": 609.3333333333334, - "r_x3": 197.66666666666669, - "r_y3": 609.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.96467484, - "from_ocr": true - }, - { - "index": 23, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 168.66666666666669, - "r_y0": 601.0, - "r_x1": 133.0, - "r_y1": 601.0, - "r_x2": 133.0, - "r_y2": 609.3333333333334, - "r_x3": 168.66666666666669, - "r_y3": 609.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "column", - "orig": "column", - "text_direction": "left_to_right", - "confidence": 0.95497986, - "from_ocr": true - }, - { - "index": 24, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 437.3333333333333, - "r_y0": 554.6666666666666, - "r_x1": 408.3333333333333, - "r_y1": 554.6666666666666, - "r_x2": 408.3333333333333, - "r_y2": 563.3333333333334, - "r_x3": 437.3333333333333, - "r_y3": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "Some", - "orig": "Some", - "text_direction": "left_to_right", - "confidence": 0.95944489, - "from_ocr": true - }, - { - "index": 25, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 404.0, - "r_y0": 554.6666666666666, - "r_x1": 386.3333333333333, - "r_y1": 554.6666666666666, - "r_x2": 386.3333333333333, - "r_y2": 561.0, - "r_x3": 404.0, - "r_y3": 561.0, - "coord_origin": "TOPLEFT" - }, - "text": "row", - "orig": "row", - "text_direction": "left_to_right", - "confidence": 0.9680950199999999, - "from_ocr": true - }, - { - "index": 26, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 326.33333333333337, - "r_y0": 554.6666666666666, - "r_x1": 299.0, - "r_y1": 554.6666666666666, - "r_x2": 299.0, - "r_y2": 561.0, - "r_x3": 326.33333333333337, - "r_y3": 561.0, - "coord_origin": "TOPLEFT" - }, - "text": "some", - "orig": "some", - "text_direction": "left_to_right", - "confidence": 0.9569136, - "from_ocr": true - }, - { - "index": 27, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 295.33333333333337, - "r_y0": 554.6666666666666, - "r_x1": 279.0, - "r_y1": 554.6666666666666, - "r_x2": 279.0, - "r_y2": 563.3333333333334, - "r_x3": 295.33333333333337, - "r_y3": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "cell", - "orig": "cell", - "text_direction": "left_to_right", - "confidence": 0.9622145799999999, - "from_ocr": true - }, - { - "index": 28, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 213.66666666666666, - "r_y0": 554.6666666666666, - "r_x1": 190.0, - "r_y1": 554.6666666666666, - "r_x2": 190.0, - "r_y2": 563.3333333333334, - "r_x3": 213.66666666666666, - "r_y3": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "have", - "orig": "have", - "text_direction": "left_to_right", - "confidence": 0.96403, - "from_ocr": true - }, - { - "index": 29, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 186.0, - "r_y0": 554.6666666666666, - "r_x1": 149.0, - "r_y1": 554.6666666666666, - "r_x2": 149.0, - "r_y2": 563.0, - "r_x3": 186.0, - "r_y3": 563.0, - "coord_origin": "TOPLEFT" - }, - "text": "content", - "orig": "content", - "text_direction": "left_to_right", - "confidence": 0.96691612, - "from_ocr": true - }, - { - "index": 30, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 451.6666666666667, - "r_y0": 508.3333333333333, - "r_x1": 422.6666666666667, - "r_y1": 508.3333333333333, - "r_x2": 422.6666666666667, - "r_y2": 517.0, - "r_x3": 451.6666666666667, - "r_y3": 517.0, - "coord_origin": "TOPLEFT" - }, - "text": "Some", - "orig": "Some", - "text_direction": "left_to_right", - "confidence": 0.9684503200000001, - "from_ocr": true - }, - { - "index": 31, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 419.0, - "r_y0": 508.3333333333333, - "r_x1": 393.0, - "r_y1": 508.3333333333333, - "r_x2": 393.0, - "r_y2": 516.6666666666666, - "r_x3": 419.0, - "r_y3": 516.6666666666666, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.96073517, - "from_ocr": true - }, - { - "index": 32, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 389.3333333333333, - "r_y0": 508.3333333333333, - "r_x1": 371.6666666666667, - "r_y1": 508.3333333333333, - "r_x2": 371.6666666666667, - "r_y2": 514.6666666666666, - "r_x3": 389.3333333333333, - "r_y3": 514.6666666666666, - "coord_origin": "TOPLEFT" - }, - "text": "row", - "orig": "row", - "text_direction": "left_to_right", - "confidence": 0.9615368700000001, - "from_ocr": true - }, - { - "index": 33, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 329.0, - "r_y0": 508.3333333333333, - "r_x1": 303.0, - "r_y1": 508.3333333333333, - "r_x2": 303.0, - "r_y2": 517.0, - "r_x3": 329.0, - "r_y3": 517.0, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.9626261100000001, - "from_ocr": true - }, - { - "index": 34, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 299.66666666666663, - "r_y0": 508.3333333333333, - "r_x1": 275.66666666666663, - "r_y1": 508.3333333333333, - "r_x2": 275.66666666666663, - "r_y2": 517.0, - "r_x3": 299.66666666666663, - "r_y3": 517.0, - "coord_origin": "TOPLEFT" - }, - "text": "don't", - "orig": "don't", - "text_direction": "left_to_right", - "confidence": 0.96669136, + "confidence": 95.0, "from_ocr": true } ], "children": [ - { - "id": 7, - "label": "text", - "bbox": { - "l": 268.33333333333337, - "t": 601.0, - "r": 337.0, - "b": 609.6666666666666, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.7441245913505554, - "cells": [ - { - "index": 19, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 337.0, - "r_y0": 601.0, - "r_x1": 308.0, - "r_y1": 601.0, - "r_x2": 308.0, - "r_y2": 609.6666666666666, - "r_x3": 337.0, - "r_y3": 609.6666666666666, - "coord_origin": "TOPLEFT" - }, - "text": "Some", - "orig": "Some", - "text_direction": "left_to_right", - "confidence": 0.95841644, - "from_ocr": true - }, - { - "index": 20, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 304.0, - "r_y0": 601.0, - "r_x1": 268.33333333333337, - "r_y1": 601.0, - "r_x2": 268.33333333333337, - "r_y2": 609.3333333333334, - "r_x3": 304.0, - "r_y3": 609.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "column", - "orig": "column", - "text_direction": "left_to_right", - "confidence": 0.95624527, - "from_ocr": true - } - ], - "children": [] - }, { "id": 1, "label": "text", "bbox": { - "l": 133.0, - "t": 601.0, - "r": 230.66666666666666, - "b": 609.6666666666666, + "l": 602.0, + "t": 485.66666666666663, + "r": 694.6666666666666, + "b": 506.3333333333333, "coord_origin": "TOPLEFT" }, - "confidence": 0.7668525576591492, + "confidence": 90.0, "cells": [ { - "index": 21, + "index": 0, "rgba": { "r": 0, "g": 0, @@ -6079,135 +4481,20 @@ "a": 255 }, "rect": { - "r_x0": 230.66666666666666, - "r_y0": 601.0, - "r_x1": 201.66666666666669, - "r_y1": 601.0, - "r_x2": 201.66666666666669, - "r_y2": 609.6666666666666, - "r_x3": 230.66666666666666, - "r_y3": 609.6666666666666, + "r_x0": 694.6666666666666, + "r_y0": 485.66666666666663, + "r_x1": 602.0, + "r_y1": 485.66666666666663, + "r_x2": 602.0, + "r_y2": 506.3333333333333, + "r_x3": 694.6666666666666, + "r_y3": 506.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 0.96296555, - "from_ocr": true - }, - { - "index": 22, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 197.66666666666669, - "r_y0": 601.0, - "r_x1": 172.0, - "r_y1": 601.0, - "r_x2": 172.0, - "r_y2": 609.3333333333334, - "r_x3": 197.66666666666669, - "r_y3": 609.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.96467484, - "from_ocr": true - }, - { - "index": 23, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 168.66666666666669, - "r_y0": 601.0, - "r_x1": 133.0, - "r_y1": 601.0, - "r_x2": 133.0, - "r_y2": 609.3333333333334, - "r_x3": 168.66666666666669, - "r_y3": 609.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "column", - "orig": "column", - "text_direction": "left_to_right", - "confidence": 0.95497986, - "from_ocr": true - } - ], - "children": [] - }, - { - "id": 4, - "label": "text", - "bbox": { - "l": 386.3333333333333, - "t": 554.6666666666666, - "r": 437.3333333333333, - "b": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.7588309049606323, - "cells": [ - { - "index": 24, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 437.3333333333333, - "r_y0": 554.6666666666666, - "r_x1": 408.3333333333333, - "r_y1": 554.6666666666666, - "r_x2": 408.3333333333333, - "r_y2": 563.3333333333334, - "r_x3": 437.3333333333333, - "r_y3": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "Some", - "orig": "Some", - "text_direction": "left_to_right", - "confidence": 0.95944489, - "from_ocr": true - }, - { - "index": 25, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 404.0, - "r_y0": 554.6666666666666, - "r_x1": 386.3333333333333, - "r_y1": 554.6666666666666, - "r_x2": 386.3333333333333, - "r_y2": 561.0, - "r_x3": 404.0, - "r_y3": 561.0, - "coord_origin": "TOPLEFT" - }, - "text": "row", - "orig": "row", - "text_direction": "left_to_right", - "confidence": 0.9680950199999999, + "confidence": 90.0, "from_ocr": true } ], @@ -6217,16 +4504,16 @@ "id": 2, "label": "text", "bbox": { - "l": 279.0, - "t": 554.6666666666666, - "r": 326.33333333333337, - "b": 563.3333333333334, + "l": 610.0, + "t": 454.33333333333337, + "r": 680.0, + "b": 475.0, "coord_origin": "TOPLEFT" }, - "confidence": 0.7627862095832825, + "confidence": 90.0, "cells": [ { - "index": 26, + "index": 1, "rgba": { "r": 0, "g": 0, @@ -6234,110 +4521,20 @@ "a": 255 }, "rect": { - "r_x0": 326.33333333333337, - "r_y0": 554.6666666666666, - "r_x1": 299.0, - "r_y1": 554.6666666666666, - "r_x2": 299.0, - "r_y2": 561.0, - "r_x3": 326.33333333333337, - "r_y3": 561.0, + "r_x0": 680.0, + "r_y0": 454.33333333333337, + "r_x1": 610.0, + "r_y1": 454.33333333333337, + "r_x2": 610.0, + "r_y2": 475.0, + "r_x3": 680.0, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "some", - "orig": "some", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 0.9569136, - "from_ocr": true - }, - { - "index": 27, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 295.33333333333337, - "r_y0": 554.6666666666666, - "r_x1": 279.0, - "r_y1": 554.6666666666666, - "r_x2": 279.0, - "r_y2": 563.3333333333334, - "r_x3": 295.33333333333337, - "r_y3": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "cell", - "orig": "cell", - "text_direction": "left_to_right", - "confidence": 0.9622145799999999, - "from_ocr": true - } - ], - "children": [] - }, - { - "id": 5, - "label": "text", - "bbox": { - "l": 149.0, - "t": 554.6666666666666, - "r": 213.66666666666666, - "b": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.7541249394416809, - "cells": [ - { - "index": 28, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 213.66666666666666, - "r_y0": 554.6666666666666, - "r_x1": 190.0, - "r_y1": 554.6666666666666, - "r_x2": 190.0, - "r_y2": 563.3333333333334, - "r_x3": 213.66666666666666, - "r_y3": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "text": "have", - "orig": "have", - "text_direction": "left_to_right", - "confidence": 0.96403, - "from_ocr": true - }, - { - "index": 29, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 186.0, - "r_y0": 554.6666666666666, - "r_x1": 149.0, - "r_y1": 554.6666666666666, - "r_x2": 149.0, - "r_y2": 563.0, - "r_x3": 186.0, - "r_y3": 563.0, - "coord_origin": "TOPLEFT" - }, - "text": "content", - "orig": "content", - "text_direction": "left_to_right", - "confidence": 0.96691612, + "confidence": 90.0, "from_ocr": true } ], @@ -6347,16 +4544,16 @@ "id": 3, "label": "text", "bbox": { - "l": 371.6666666666667, - "t": 508.3333333333333, - "r": 451.6666666666667, - "b": 517.0, + "l": 623.3333333333334, + "t": 392.0, + "r": 670.3333333333334, + "b": 408.0, "coord_origin": "TOPLEFT" }, - "confidence": 0.7616423964500427, + "confidence": 96.0, "cells": [ { - "index": 30, + "index": 2, "rgba": { "r": 0, "g": 0, @@ -6364,24 +4561,39 @@ "a": 255 }, "rect": { - "r_x0": 451.6666666666667, - "r_y0": 508.3333333333333, - "r_x1": 422.6666666666667, - "r_y1": 508.3333333333333, - "r_x2": 422.6666666666667, - "r_y2": 517.0, - "r_x3": 451.6666666666667, - "r_y3": 517.0, + "r_x0": 670.3333333333334, + "r_y0": 392.0, + "r_x1": 623.3333333333334, + "r_y1": 392.0, + "r_x2": 623.3333333333334, + "r_y2": 408.0, + "r_x3": 670.3333333333334, + "r_y3": 408.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9684503200000001, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 4, + "label": "text", + "bbox": { + "l": 623.3333333333334, + "t": 312.0, + "r": 670.3333333333334, + "b": 328.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ { - "index": 31, + "index": 3, "rgba": { "r": 0, "g": 0, @@ -6389,24 +4601,39 @@ "a": 255 }, "rect": { - "r_x0": 419.0, - "r_y0": 508.3333333333333, - "r_x1": 393.0, - "r_y1": 508.3333333333333, - "r_x2": 393.0, - "r_y2": 516.6666666666666, - "r_x3": 419.0, - "r_y3": 516.6666666666666, + "r_x0": 670.3333333333334, + "r_y0": 312.0, + "r_x1": 623.3333333333334, + "r_y1": 312.0, + "r_x2": 623.3333333333334, + "r_y2": 328.0, + "r_x3": 670.3333333333334, + "r_y3": 328.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96073517, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 5, + "label": "text", + "bbox": { + "l": 428.3333333333333, + "t": 485.66666666666663, + "r": 559.6666666666667, + "b": 506.3333333333333, + "coord_origin": "TOPLEFT" + }, + "confidence": 92.0, + "cells": [ { - "index": 32, + "index": 4, "rgba": { "r": 0, "g": 0, @@ -6414,20 +4641,20 @@ "a": 255 }, "rect": { - "r_x0": 389.3333333333333, - "r_y0": 508.3333333333333, - "r_x1": 371.6666666666667, - "r_y1": 508.3333333333333, - "r_x2": 371.6666666666667, - "r_y2": 514.6666666666666, - "r_x3": 389.3333333333333, - "r_y3": 514.6666666666666, + "r_x0": 559.6666666666667, + "r_y0": 485.66666666666663, + "r_x1": 428.3333333333333, + "r_y1": 485.66666666666663, + "r_x2": 428.3333333333333, + "r_y2": 506.3333333333333, + "r_x3": 559.6666666666667, + "r_y3": 506.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 0.9615368700000001, + "confidence": 92.0, "from_ocr": true } ], @@ -6437,16 +4664,16 @@ "id": 6, "label": "text", "bbox": { - "l": 275.66666666666663, - "t": 508.3333333333333, - "r": 329.0, - "b": 517.0, + "l": 456.0, + "t": 459.0, + "r": 526.6666666666667, + "b": 475.0, "coord_origin": "TOPLEFT" }, - "confidence": 0.7468306422233582, + "confidence": 94.0, "cells": [ { - "index": 33, + "index": 5, "rgba": { "r": 0, "g": 0, @@ -6454,24 +4681,39 @@ "a": 255 }, "rect": { - "r_x0": 329.0, - "r_y0": 508.3333333333333, - "r_x1": 303.0, - "r_y1": 508.3333333333333, - "r_x2": 303.0, - "r_y2": 517.0, - "r_x3": 329.0, - "r_y3": 517.0, + "r_x0": 526.6666666666667, + "r_y0": 459.0, + "r_x1": 456.0, + "r_y1": 459.0, + "r_x2": 456.0, + "r_y2": 475.0, + "r_x3": 526.6666666666667, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9626261100000001, + "confidence": 94.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 7, + "label": "text", + "bbox": { + "l": 442.3333333333333, + "t": 408.0, + "r": 545.0, + "b": 424.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 91.0, + "cells": [ { - "index": 34, + "index": 6, "rgba": { "r": 0, "g": 0, @@ -6479,20 +4721,380 @@ "a": 255 }, "rect": { - "r_x0": 299.66666666666663, - "r_y0": 508.3333333333333, - "r_x1": 275.66666666666663, - "r_y1": 508.3333333333333, - "r_x2": 275.66666666666663, - "r_y2": 517.0, - "r_x3": 299.66666666666663, - "r_y3": 517.0, + "r_x0": 545.0, + "r_y0": 408.0, + "r_x1": 442.3333333333333, + "r_y1": 408.0, + "r_x2": 442.3333333333333, + "r_y2": 424.0, + "r_x3": 545.0, + "r_y3": 424.0, "coord_origin": "TOPLEFT" }, - "text": "don't", - "orig": "don't", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.96669136, + "confidence": 91.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 8, + "label": "text", + "bbox": { + "l": 468.0, + "t": 376.0, + "r": 515.0, + "b": 392.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ + { + "index": 7, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 515.0, + "r_y0": 376.0, + "r_x1": 468.0, + "r_y1": 376.0, + "r_x2": 468.0, + "r_y2": 392.0, + "r_x3": 515.0, + "r_y3": 392.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 9, + "label": "text", + "bbox": { + "l": 442.3333333333333, + "t": 328.0, + "r": 545.0, + "b": 344.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ + { + "index": 8, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 545.0, + "r_y0": 328.0, + "r_x1": 442.3333333333333, + "r_y1": 328.0, + "r_x2": 442.3333333333333, + "r_y2": 344.0, + "r_x3": 545.0, + "r_y3": 344.0, + "coord_origin": "TOPLEFT" + }, + "text": "Some other", + "orig": "Some other", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 10, + "label": "text", + "bbox": { + "l": 468.0, + "t": 296.6666666666667, + "r": 515.0, + "b": 312.6666666666667, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 9, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 515.0, + "r_y0": 296.6666666666667, + "r_x1": 468.0, + "r_y1": 296.6666666666667, + "r_x2": 468.0, + "r_y2": 312.6666666666667, + "r_x3": 515.0, + "r_y3": 312.6666666666667, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 11, + "label": "text", + "bbox": { + "l": 274.0, + "t": 490.33333333333337, + "r": 385.6666666666667, + "b": 506.3333333333333, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 10, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 385.6666666666667, + "r_y0": 490.33333333333337, + "r_x1": 274.0, + "r_y1": 490.33333333333337, + "r_x2": 274.0, + "r_y2": 506.3333333333333, + "r_x3": 385.6666666666667, + "r_y3": 506.3333333333333, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 12, + "label": "text", + "bbox": { + "l": 292.66666666666663, + "t": 459.0, + "r": 363.0, + "b": 475.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ + { + "index": 11, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 363.0, + "r_y0": 459.0, + "r_x1": 292.66666666666663, + "r_y1": 459.0, + "r_x2": 292.66666666666663, + "r_y2": 475.0, + "r_x3": 363.0, + "r_y3": 475.0, + "coord_origin": "TOPLEFT" + }, + "text": "column", + "orig": "column", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 13, + "label": "text", + "bbox": { + "l": 278.0, + "t": 408.0, + "r": 383.6666666666667, + "b": 424.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ + { + "index": 12, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 383.6666666666667, + "r_y0": 408.0, + "r_x1": 278.0, + "r_y1": 408.0, + "r_x2": 278.0, + "r_y2": 424.0, + "r_x3": 383.6666666666667, + "r_y3": 424.0, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 14, + "label": "text", + "bbox": { + "l": 304.33333333333337, + "t": 376.0, + "r": 351.33333333333337, + "b": 392.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 351.33333333333337, + "r_y0": 376.0, + "r_x1": 304.33333333333337, + "r_y1": 376.0, + "r_x2": 304.33333333333337, + "r_y2": 392.0, + "r_x3": 351.33333333333337, + "r_y3": 392.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 15, + "label": "text", + "bbox": { + "l": 278.0, + "t": 328.0, + "r": 383.6666666666667, + "b": 344.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 383.6666666666667, + "r_y0": 328.0, + "r_x1": 278.0, + "r_y1": 328.0, + "r_x2": 278.0, + "r_y2": 344.0, + "r_x3": 383.6666666666667, + "r_y3": 344.0, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 16, + "label": "text", + "bbox": { + "l": 304.33333333333337, + "t": 296.6666666666667, + "r": 351.33333333333337, + "b": 312.6666666666667, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 351.33333333333337, + "r_y0": 296.6666666666667, + "r_x1": 304.33333333333337, + "r_y1": 296.6666666666667, + "r_x2": 304.33333333333337, + "r_y2": 312.6666666666667, + "r_x3": 351.33333333333337, + "r_y3": 312.6666666666667, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, "from_ocr": true } ], @@ -6502,17 +5104,17 @@ }, "text": null, "otsl_seq": [ - "ecel", + "ched", "ched", "ched", "nl", - "rhed", + "fcel", "fcel", "fcel", "nl", - "rhed", "fcel", - "ecel", + "fcel", + "fcel", "nl" ], "num_rows": 3, @@ -6520,29 +5122,48 @@ "table_cells": [ { "bbox": { - "l": 308.0, - "t": 601.0, - "r": 337.0, - "b": 609.6666666666666, + "l": 97.33333333333337, + "t": 105.66666666666669, + "r": 190.0, + "b": 126.33333333333337, "coord_origin": "TOPLEFT" }, "row_span": 1, "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "Some column", + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 0, + "end_col_offset_idx": 1, + "text": "Vertically merged", + "column_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 121.66666666666663, + "t": 204.0, + "r": 168.66666666666663, + "b": 220.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 0, + "end_col_offset_idx": 1, + "text": "value", "column_header": false, "row_header": false, "row_section": false }, { "bbox": { - "l": 201.66666666666669, - "t": 601.0, - "r": 230.66666666666666, - "b": 609.6666666666666, + "l": 121.66666666666663, + "t": 284.0, + "r": 168.66666666666663, + "b": 300.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -6551,17 +5172,93 @@ "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, - "text": "Some other column", + "text": "value", "column_header": false, - "row_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 232.33333333333326, + "t": 105.66666666666669, + "r": 363.6666666666667, + "b": 126.33333333333337, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Other merged column", + "column_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 247.0, + "t": 188.0, + "r": 349.6666666666667, + "b": 204.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Some other value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 247.0, + "t": 268.0, + "r": 349.6666666666667, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 2, + "end_row_offset_idx": 3, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Some other value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 406.3333333333333, + "t": 105.66666666666669, + "r": 518.0, + "b": 121.66666666666663, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another column", + "column_header": true, + "row_header": false, "row_section": false }, { "bbox": { "l": 408.3333333333333, - "t": 554.6666666666666, - "r": 437.3333333333333, - "b": 563.3333333333334, + "t": 188.0, + "r": 514.0, + "b": 204.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -6570,84 +5267,27 @@ "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, - "text": "Some row", + "text": "Yet another value", "column_header": false, "row_header": false, "row_section": false }, { "bbox": { - "l": 299.0, - "t": 554.6666666666666, - "r": 326.33333333333337, - "b": 561.0, + "l": 408.3333333333333, + "t": 268.0, + "r": 514.0, + "b": 284.0, "coord_origin": "TOPLEFT" }, "row_span": 1, "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "some cell", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 190.0, - "t": 554.6666666666666, - "r": 213.66666666666666, - "b": 563.3333333333334, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "have content", - "column_header": false, - "row_header": true, - "row_section": false - }, - { - "bbox": { - "l": 422.6666666666667, - "t": 508.3333333333333, - "r": 451.6666666666667, - "b": 517.0, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, + "start_row_offset_idx": 2, + "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, - "text": "Some other row", - "column_header": true, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 303.0, - "t": 508.3333333333333, - "r": 329.0, - "b": 517.0, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "other don't", - "column_header": true, + "text": "Yet another value", + "column_header": false, "row_header": false, "row_section": false } diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_270.doctags.txt b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_270.doctags.txt index 7ba27bf2..8afe2766 100644 --- a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_270.doctags.txt +++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_270.doctags.txt @@ -1,9 +1,6 @@ - -and last row 2and row 1this is row 0 -nothingsome cellsColumn 0 -otherhave contentColumn 1 -insidehaveandColumn 2 + +Yet another valueSome other valuevalue
\ No newline at end of file diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_270.json b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_270.json index 0594cfe0..070a848c 100644 --- a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_270.json +++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_270.json @@ -27,13 +27,13 @@ "file-info": { "filename": "ocr_test_rotated_270.pdf", "filename-prov": null, - "document-hash": "6fefac7b5b41551979e0acb695ca99549a91784619c82c6095d8130179431437", + "document-hash": "753140dc9b8c39b67c6f6712e2a1de4c364c808ca09d13dd05b79c23192429dc", "#-pages": 1, "collection-name": null, "description": null, "page-hashes": [ { - "hash": "68730d83582a6ac50587fdba1a8ce6b263d682a0daf984522d4dbe9f9e3d4fbe", + "hash": "c8fa256d58940f76c5e0ec6b65548a2e939f867c2c75d0ee27f5f70ff32a44be", "model": "default", "page": 1 } @@ -44,92 +44,18 @@ "name": "Table", "type": "table", "$ref": "#/tables/0" - }, - { - "prov": [ - { - "bbox": [ - 640.87671, - 235.72681, - 653.16504, - 533.28552 - ], - "page": 1, - "span": [ - 0, - 49 - ], - "__ref_s3_data": null - } - ], - "text": "heteststartswithsomerandomtextandthenatableimage:", - "type": "paragraph", - "payload": null, - "name": "Text", - "font": null - }, - { - "name": "Picture", - "type": "figure", - "$ref": "#/figures/0" - }, - { - "prov": [ - { - "bbox": [ - 690.10272, - 194.03976, - 719.1490499999999, - 410.73663 - ], - "page": 1, - "span": [ - 0, - 20 - ], - "__ref_s3_data": null - } - ], - "text": "This is a table test", - "type": "subtitle-level-1", - "payload": null, - "name": "Section-header", - "font": null - } - ], - "figures": [ - { - "prov": [ - { - "bbox": [ - 668.9778442382812, - 532.5339431762695, - 683.4164962768555, - 541.4290084838867 - ], - "page": 1, - "span": [ - 0, - 0 - ], - "__ref_s3_data": null - } - ], - "text": "", - "type": "figure", - "payload": null, - "bounding-box": null } ], + "figures": [], "tables": [ { "prov": [ { "bbox": [ - 460.5577697753906, - 112.21743774414062, - 599.0364074707031, - 469.385986328125 + 277.4178771972656, + 240.90216064453125, + 524.3541717529297, + 722.9614028930664 ], "page": 1, "span": [ @@ -142,9 +68,96 @@ "text": "", "type": "table", "payload": null, - "#-cols": 0, - "#-rows": 0, - "data": [], + "#-cols": 3, + "#-rows": 1, + "data": [ + [ + { + "bbox": [ + 98.0, + 296.6666666666667, + 203.66666666666669, + 344.0 + ], + "spans": [ + [ + 0, + 0 + ] + ], + "text": "Yet another value", + "type": "body", + "col": 0, + "col-header": false, + "col-span": [ + 0, + 1 + ], + "row": 0, + "row-header": false, + "row-span": [ + 0, + 1 + ] + }, + { + "bbox": [ + 262.3333333333333, + 296.6666666666667, + 365.0, + 344.0 + ], + "spans": [ + [ + 0, + 1 + ] + ], + "text": "Some other value", + "type": "body", + "col": 1, + "col-header": false, + "col-span": [ + 1, + 2 + ], + "row": 0, + "row-header": false, + "row-span": [ + 0, + 1 + ] + }, + { + "bbox": [ + 443.33333333333337, + 312.0, + 490.33333333333337, + 328.0 + ], + "spans": [ + [ + 0, + 2 + ] + ], + "text": "value", + "type": "body", + "col": 2, + "col-header": false, + "col-span": [ + 2, + 3 + ], + "row": 0, + "row-header": false, + "row-span": [ + 0, + 1 + ] + } + ] + ], "model": null, "bounding-box": null } @@ -154,9 +167,9 @@ "footnotes": [], "page-dimensions": [ { - "height": 612.0, + "height": 792.0, "page": 1, - "width": 792.0 + "width": 612.0 } ], "page-footers": [], diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_270.md b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_270.md index f423a6c2..e69de29b 100644 --- a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_270.md +++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_270.md @@ -1,5 +0,0 @@ -| and last row 2 | and row 1 | this is row 0 | | -|------------------|-------------|-----------------|----------| -| nothing | | some cells | Column 0 | -| | other | have content | Column 1 | -| inside | have | and | Column 2 | \ No newline at end of file diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_270.pages.json b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_270.pages.json index 87a75a66..3638ffc4 100644 --- a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_270.pages.json +++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_270.pages.json @@ -2,8 +2,8 @@ { "page_no": 0, "size": { - "width": 792.0, - "height": 612.0 + "width": 612.0, + "height": 792.0 }, "parsed_page": { "dimension": { @@ -11,47 +11,47 @@ "rect": { "r_x0": 0.0, "r_y0": 0.0, - "r_x1": 612.0, + "r_x1": 792.0, "r_y1": 0.0, - "r_x2": 612.0, - "r_y2": 792.0, + "r_x2": 792.0, + "r_y2": 612.0, "r_x3": 0.0, - "r_y3": 792.0, + "r_y3": 612.0, "coord_origin": "BOTTOMLEFT" }, "boundary_type": "crop_box", "art_bbox": { "l": 0.0, - "t": 792.0, - "r": 612.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" }, "bleed_bbox": { "l": 0.0, - "t": 792.0, - "r": 612.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" }, "crop_bbox": { "l": 0.0, - "t": 792.0, - "r": 612.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" }, "media_bbox": { "l": 0.0, - "t": 792.0, - "r": 612.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" }, "trim_bbox": { "l": 0.0, - "t": 792.0, - "r": 612.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" } @@ -69,21 +69,21 @@ "a": 255 }, "rect": { - "r_x0": 690.10272, - "r_y0": 417.96024, - "r_x1": 719.1490499999999, - "r_y1": 417.96024, - "r_x2": 719.1490499999999, - "r_y2": 201.26337, - "r_x3": 690.10272, - "r_y3": 201.26337, + "r_x0": 485.66666666666663, + "r_y0": 97.33333333333333, + "r_x1": 485.66666666666663, + "r_y1": 190.0, + "r_x2": 506.3333333333333, + "r_y2": 190.0, + "r_x3": 506.3333333333333, + "r_y3": 97.33333333333333, "coord_origin": "TOPLEFT" }, - "text": "This is a table test ", - "orig": "This is a table test ", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 89.0, + "from_ocr": true }, { "index": 1, @@ -94,21 +94,21 @@ "a": 255 }, "rect": { - "r_x0": 669.96899, - "r_y0": 78.71936000000005, - "r_x1": 682.25806, - "r_y1": 78.71936000000005, - "r_x2": 682.25806, - "r_y2": 71.99987999999996, - "r_x3": 669.96899, - "r_y3": 71.99987999999996, + "r_x0": 454.33333333333337, + "r_y0": 112.0, + "r_x1": 454.33333333333337, + "r_y1": 182.33333333333334, + "r_x2": 475.0, + "r_y2": 182.33333333333334, + "r_x3": 475.0, + "r_y3": 112.0, "coord_origin": "TOPLEFT" }, - "text": " T", - "orig": " T", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 2, @@ -119,21 +119,21 @@ "a": 255 }, "rect": { - "r_x0": 640.87671, - "r_y0": 376.27319, - "r_x1": 653.16504, - "r_y1": 376.27319, - "r_x2": 653.16504, - "r_y2": 78.71447999999998, - "r_x3": 640.87671, - "r_y3": 78.71447999999998, + "r_x0": 392.0, + "r_y0": 121.66666666666667, + "r_x1": 392.0, + "r_y1": 168.66666666666666, + "r_x2": 408.0, + "r_y2": 168.66666666666666, + "r_x3": 408.0, + "r_y3": 121.66666666666667, "coord_origin": "TOPLEFT" }, - "text": "heteststartswithsomerandomtextandthenatableimage: ", - "orig": "heteststartswithsomerandomtextandthenatableimage: ", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 3, @@ -144,21 +144,21 @@ "a": 255 }, "rect": { - "r_x0": 408.21301, - "r_y0": 309.05624, - "r_x1": 420.50208, - "r_y1": 309.05624, - "r_x2": 420.50208, - "r_y2": 306.0, - "r_x3": 408.21301, - "r_y3": 306.0, + "r_x0": 312.0, + "r_y0": 121.66666666666667, + "r_x1": 312.0, + "r_y1": 168.66666666666666, + "r_x2": 328.0, + "r_y2": 168.66666666666666, + "r_x3": 328.0, + "r_y3": 121.66666666666667, "coord_origin": "TOPLEFT" }, - "text": " ", - "orig": " ", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 4, @@ -169,20 +169,20 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 275.0, - "r_x1": 572.0, - "r_y1": 304.0, - "r_x2": 580.6666666666666, - "r_y2": 304.0, - "r_x3": 580.6666666666666, - "r_y3": 275.0, + "r_x0": 485.66666666666663, + "r_y0": 232.66666666666666, + "r_x1": 485.66666666666663, + "r_y1": 364.0, + "r_x2": 506.3333333333333, + "r_y2": 364.0, + "r_x3": 506.3333333333333, + "r_y3": 232.66666666666666, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 0.95741158, + "confidence": 92.0, "from_ocr": true }, { @@ -194,20 +194,20 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 308.0, - "r_x1": 572.0, - "r_y1": 343.66666666666663, - "r_x2": 580.3333333333334, - "r_y2": 343.66666666666663, - "r_x3": 580.3333333333334, - "r_y3": 308.0, + "r_x0": 459.0, + "r_y0": 265.66666666666663, + "r_x1": 459.0, + "r_y1": 336.0, + "r_x2": 475.0, + "r_y2": 336.0, + "r_x3": 475.0, + "r_y3": 265.66666666666663, "coord_origin": "TOPLEFT" }, "text": "column", "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9541709899999999, + "confidence": 94.0, "from_ocr": true }, { @@ -219,20 +219,20 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 381.3333333333333, - "r_x1": 572.0, - "r_y1": 410.3333333333333, - "r_x2": 580.6666666666666, - "r_y2": 410.3333333333333, - "r_x3": 580.6666666666666, - "r_y3": 381.3333333333333, + "r_x0": 408.0, + "r_y0": 247.0, + "r_x1": 408.0, + "r_y1": 349.6666666666667, + "r_x2": 424.0, + "r_y2": 349.6666666666667, + "r_x3": 424.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.96515053, + "confidence": 89.0, "from_ocr": true }, { @@ -244,20 +244,20 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 414.3333333333333, - "r_x1": 572.0, - "r_y1": 440.3333333333333, - "r_x2": 580.3333333333334, - "r_y2": 440.3333333333333, - "r_x3": 580.3333333333334, - "r_y3": 414.3333333333333, + "r_x0": 376.0, + "r_y0": 277.0, + "r_x1": 376.0, + "r_y1": 324.3333333333333, + "r_x2": 392.0, + "r_y2": 324.3333333333333, + "r_x3": 392.0, + "r_y3": 277.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9623101, + "confidence": 96.0, "from_ocr": true }, { @@ -269,20 +269,20 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 443.3333333333333, - "r_x1": 572.0, - "r_y1": 479.3333333333333, - "r_x2": 580.3333333333334, - "r_y2": 479.3333333333333, - "r_x3": 580.3333333333334, - "r_y3": 443.3333333333333, + "r_x0": 328.0, + "r_y0": 247.0, + "r_x1": 328.0, + "r_y1": 349.6666666666667, + "r_x2": 344.0, + "r_y2": 349.6666666666667, + "r_x3": 344.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.94704376, + "confidence": 95.0, "from_ocr": true }, { @@ -294,20 +294,20 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 175.0, - "r_x1": 525.6666666666666, - "r_y1": 204.0, - "r_x2": 534.3333333333334, - "r_y2": 204.0, - "r_x3": 534.3333333333334, - "r_y3": 175.0, + "r_x0": 296.6666666666667, + "r_y0": 277.33333333333337, + "r_x1": 296.6666666666667, + "r_y1": 324.3333333333333, + "r_x2": 312.6666666666667, + "r_y2": 324.3333333333333, + "r_x3": 312.6666666666667, + "r_y3": 277.33333333333337, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96139633, + "confidence": 96.0, "from_ocr": true }, { @@ -319,20 +319,20 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 208.0, - "r_x1": 525.6666666666666, - "r_y1": 225.66666666666669, - "r_x2": 532.0, - "r_y2": 225.66666666666669, - "r_x3": 532.0, - "r_y3": 208.0, + "r_x0": 490.33333333333337, + "r_y0": 406.3333333333333, + "r_x1": 490.33333333333337, + "r_y1": 518.3333333333333, + "r_x2": 506.3333333333333, + "r_y2": 518.3333333333333, + "r_x3": 506.3333333333333, + "r_y3": 406.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.9561322, + "confidence": 95.0, "from_ocr": true }, { @@ -344,20 +344,20 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 285.66666666666663, - "r_x1": 525.6666666666666, - "r_y1": 313.0, - "r_x2": 532.0, - "r_y2": 313.0, - "r_x3": 532.0, - "r_y3": 285.66666666666663, + "r_x0": 459.0, + "r_y0": 429.3333333333333, + "r_x1": 459.0, + "r_y1": 499.3333333333333, + "r_x2": 475.0, + "r_y2": 499.3333333333333, + "r_x3": 475.0, + "r_y3": 429.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "some", - "orig": "some", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9615657, + "confidence": 94.0, "from_ocr": true }, { @@ -369,20 +369,20 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 317.0, - "r_x1": 525.6666666666666, - "r_y1": 333.0, - "r_x2": 534.3333333333334, - "r_y2": 333.0, - "r_x3": 534.3333333333334, - "r_y3": 317.0, + "r_x0": 408.0, + "r_y0": 408.3333333333333, + "r_x1": 408.0, + "r_y1": 514.0, + "r_x2": 424.0, + "r_y2": 514.0, + "r_x3": 424.0, + "r_y3": 408.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "cell", - "orig": "cell", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.95838455, + "confidence": 95.0, "from_ocr": true }, { @@ -394,20 +394,20 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 398.3333333333333, - "r_x1": 525.6666666666666, - "r_y1": 422.0, - "r_x2": 534.3333333333334, - "r_y2": 422.0, - "r_x3": 534.3333333333334, - "r_y3": 398.3333333333333, + "r_x0": 376.0, + "r_y0": 440.6666666666667, + "r_x1": 376.0, + "r_y1": 487.6666666666667, + "r_x2": 392.0, + "r_y2": 487.6666666666667, + "r_x3": 392.0, + "r_y3": 440.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9642998500000001, + "confidence": 96.0, "from_ocr": true }, { @@ -419,20 +419,20 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 426.0, - "r_x1": 525.6666666666666, - "r_y1": 463.0, - "r_x2": 534.0, - "r_y2": 463.0, - "r_x3": 534.0, - "r_y3": 426.0, + "r_x0": 328.0, + "r_y0": 408.3333333333333, + "r_x1": 328.0, + "r_y1": 514.0, + "r_x2": 344.0, + "r_y2": 514.0, + "r_x3": 344.0, + "r_y3": 408.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "content", - "orig": "content", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.96576363, + "confidence": 95.0, "from_ocr": true }, { @@ -444,120 +444,20 @@ "a": 255 }, "rect": { - "r_x0": 479.3333333333333, - "r_y0": 160.33333333333334, - "r_x1": 479.3333333333333, - "r_y1": 189.33333333333331, - "r_x2": 488.0, - "r_y2": 189.33333333333331, - "r_x3": 488.0, - "r_y3": 160.33333333333334, + "r_x0": 296.6666666666667, + "r_y0": 440.6666666666667, + "r_x1": 296.6666666666667, + "r_y1": 487.6666666666667, + "r_x2": 312.6666666666667, + "r_y2": 487.6666666666667, + "r_x3": 312.6666666666667, + "r_y3": 440.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96371613, - "from_ocr": true - }, - { - "index": 16, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 193.33333333333331, - "r_x1": 479.3333333333333, - "r_y1": 219.0, - "r_x2": 488.0, - "r_y2": 219.0, - "r_x3": 488.0, - "r_y3": 193.33333333333331, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.9634315499999999, - "from_ocr": true - }, - { - "index": 17, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 222.66666666666669, - "r_x1": 479.3333333333333, - "r_y1": 240.33333333333331, - "r_x2": 485.6666666666667, - "r_y2": 240.33333333333331, - "r_x3": 485.6666666666667, - "r_y3": 222.66666666666669, - "coord_origin": "TOPLEFT" - }, - "text": "row", - "orig": "row", - "text_direction": "left_to_right", - "confidence": 0.9611644699999999, - "from_ocr": true - }, - { - "index": 18, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 283.0, - "r_x1": 479.3333333333333, - "r_y1": 309.0, - "r_x2": 487.6666666666667, - "r_y2": 309.0, - "r_x3": 487.6666666666667, - "r_y3": 283.0, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.95751617, - "from_ocr": true - }, - { - "index": 19, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 312.33333333333337, - "r_x1": 479.3333333333333, - "r_y1": 336.33333333333337, - "r_x2": 488.0, - "r_y2": 336.33333333333337, - "r_x3": 488.0, - "r_y3": 312.33333333333337, - "coord_origin": "TOPLEFT" - }, - "text": "don't", - "orig": "don't", - "text_direction": "left_to_right", - "confidence": 0.9581434600000001, + "confidence": 95.0, "from_ocr": true } ], @@ -571,16 +471,16 @@ "layout": { "clusters": [ { - "id": 8, - "label": "section_header", + "id": 0, + "label": "table", "bbox": { - "l": 690.10272, - "t": 201.26337, - "r": 719.1490499999999, - "b": 417.96024, + "l": 277.4178771972656, + "t": 69.0385971069336, + "r": 524.3541717529297, + "b": 551.0978393554688, "coord_origin": "TOPLEFT" }, - "confidence": 0.7426818609237671, + "confidence": 0.9790208339691162, "cells": [ { "index": 0, @@ -591,37 +491,22 @@ "a": 255 }, "rect": { - "r_x0": 690.10272, - "r_y0": 417.96024, - "r_x1": 719.1490499999999, - "r_y1": 417.96024, - "r_x2": 719.1490499999999, - "r_y2": 201.26337, - "r_x3": 690.10272, - "r_y3": 201.26337, + "r_x0": 485.66666666666663, + "r_y0": 97.33333333333333, + "r_x1": 485.66666666666663, + "r_y1": 190.0, + "r_x2": 506.3333333333333, + "r_y2": 190.0, + "r_x3": 506.3333333333333, + "r_y3": 97.33333333333333, "coord_origin": "TOPLEFT" }, - "text": "This is a table test ", - "orig": "This is a table test ", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - } - ], - "children": [] - }, - { - "id": 13, - "label": "picture", - "bbox": { - "l": 668.9778442382812, - "t": 70.57099151611328, - "r": 683.4164962768555, - "b": 79.46605682373047, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.5229994654655457, - "cells": [ + "confidence": 89.0, + "from_ocr": true + }, { "index": 1, "rgba": { @@ -631,78 +516,22 @@ "a": 255 }, "rect": { - "r_x0": 669.96899, - "r_y0": 78.71936000000005, - "r_x1": 682.25806, - "r_y1": 78.71936000000005, - "r_x2": 682.25806, - "r_y2": 71.99987999999996, - "r_x3": 669.96899, - "r_y3": 71.99987999999996, + "r_x0": 454.33333333333337, + "r_y0": 112.0, + "r_x1": 454.33333333333337, + "r_y1": 182.33333333333334, + "r_x2": 475.0, + "r_y2": 182.33333333333334, + "r_x3": 475.0, + "r_y3": 112.0, "coord_origin": "TOPLEFT" }, - "text": " T", - "orig": " T", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - } - ], - "children": [ - { - "id": 20, - "label": "text", - "bbox": { - "l": 669.96899, - "t": 71.99987999999996, - "r": 682.25806, - "b": 78.71936000000005, - "coord_origin": "TOPLEFT" - }, - "confidence": 1.0, - "cells": [ - { - "index": 1, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 669.96899, - "r_y0": 78.71936000000005, - "r_x1": 682.25806, - "r_y1": 78.71936000000005, - "r_x2": 682.25806, - "r_y2": 71.99987999999996, - "r_x3": 669.96899, - "r_y3": 71.99987999999996, - "coord_origin": "TOPLEFT" - }, - "text": " T", - "orig": " T", - "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - } - ], - "children": [] - } - ] - }, - { - "id": 0, - "label": "text", - "bbox": { - "l": 640.87671, - "t": 78.71447999999998, - "r": 653.16504, - "b": 376.27319, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.8302523493766785, - "cells": [ + "confidence": 92.0, + "from_ocr": true + }, { "index": 2, "rgba": { @@ -712,37 +541,47 @@ "a": 255 }, "rect": { - "r_x0": 640.87671, - "r_y0": 376.27319, - "r_x1": 653.16504, - "r_y1": 376.27319, - "r_x2": 653.16504, - "r_y2": 78.71447999999998, - "r_x3": 640.87671, - "r_y3": 78.71447999999998, + "r_x0": 392.0, + "r_y0": 121.66666666666667, + "r_x1": 392.0, + "r_y1": 168.66666666666666, + "r_x2": 408.0, + "r_y2": 168.66666666666666, + "r_x3": 408.0, + "r_y3": 121.66666666666667, "coord_origin": "TOPLEFT" }, - "text": "heteststartswithsomerandomtextandthenatableimage: ", - "orig": "heteststartswithsomerandomtextandthenatableimage: ", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - } - ], - "children": [] - }, - { - "id": 11, - "label": "table", - "bbox": { - "l": 460.5577697753906, - "t": 142.614013671875, - "r": 599.0364074707031, - "b": 499.7825622558594, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.5623787045478821, - "cells": [ + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 3, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 312.0, + "r_y0": 121.66666666666667, + "r_x1": 312.0, + "r_y1": 168.66666666666666, + "r_x2": 328.0, + "r_y2": 168.66666666666666, + "r_x3": 328.0, + "r_y3": 121.66666666666667, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + }, { "index": 4, "rgba": { @@ -752,20 +591,20 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 275.0, - "r_x1": 572.0, - "r_y1": 304.0, - "r_x2": 580.6666666666666, - "r_y2": 304.0, - "r_x3": 580.6666666666666, - "r_y3": 275.0, + "r_x0": 485.66666666666663, + "r_y0": 232.66666666666666, + "r_x1": 485.66666666666663, + "r_y1": 364.0, + "r_x2": 506.3333333333333, + "r_y2": 364.0, + "r_x3": 506.3333333333333, + "r_y3": 232.66666666666666, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 0.95741158, + "confidence": 92.0, "from_ocr": true }, { @@ -777,20 +616,20 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 308.0, - "r_x1": 572.0, - "r_y1": 343.66666666666663, - "r_x2": 580.3333333333334, - "r_y2": 343.66666666666663, - "r_x3": 580.3333333333334, - "r_y3": 308.0, + "r_x0": 459.0, + "r_y0": 265.66666666666663, + "r_x1": 459.0, + "r_y1": 336.0, + "r_x2": 475.0, + "r_y2": 336.0, + "r_x3": 475.0, + "r_y3": 265.66666666666663, "coord_origin": "TOPLEFT" }, "text": "column", "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9541709899999999, + "confidence": 94.0, "from_ocr": true }, { @@ -802,20 +641,20 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 381.3333333333333, - "r_x1": 572.0, - "r_y1": 410.3333333333333, - "r_x2": 580.6666666666666, - "r_y2": 410.3333333333333, - "r_x3": 580.6666666666666, - "r_y3": 381.3333333333333, + "r_x0": 408.0, + "r_y0": 247.0, + "r_x1": 408.0, + "r_y1": 349.6666666666667, + "r_x2": 424.0, + "r_y2": 349.6666666666667, + "r_x3": 424.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.96515053, + "confidence": 89.0, "from_ocr": true }, { @@ -827,20 +666,20 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 414.3333333333333, - "r_x1": 572.0, - "r_y1": 440.3333333333333, - "r_x2": 580.3333333333334, - "r_y2": 440.3333333333333, - "r_x3": 580.3333333333334, - "r_y3": 414.3333333333333, + "r_x0": 376.0, + "r_y0": 277.0, + "r_x1": 376.0, + "r_y1": 324.3333333333333, + "r_x2": 392.0, + "r_y2": 324.3333333333333, + "r_x3": 392.0, + "r_y3": 277.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9623101, + "confidence": 96.0, "from_ocr": true }, { @@ -852,20 +691,20 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 443.3333333333333, - "r_x1": 572.0, - "r_y1": 479.3333333333333, - "r_x2": 580.3333333333334, - "r_y2": 479.3333333333333, - "r_x3": 580.3333333333334, - "r_y3": 443.3333333333333, + "r_x0": 328.0, + "r_y0": 247.0, + "r_x1": 328.0, + "r_y1": 349.6666666666667, + "r_x2": 344.0, + "r_y2": 349.6666666666667, + "r_x3": 344.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.94704376, + "confidence": 95.0, "from_ocr": true }, { @@ -877,20 +716,20 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 175.0, - "r_x1": 525.6666666666666, - "r_y1": 204.0, - "r_x2": 534.3333333333334, - "r_y2": 204.0, - "r_x3": 534.3333333333334, - "r_y3": 175.0, + "r_x0": 296.6666666666667, + "r_y0": 277.33333333333337, + "r_x1": 296.6666666666667, + "r_y1": 324.3333333333333, + "r_x2": 312.6666666666667, + "r_y2": 324.3333333333333, + "r_x3": 312.6666666666667, + "r_y3": 277.33333333333337, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96139633, + "confidence": 96.0, "from_ocr": true }, { @@ -902,20 +741,20 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 208.0, - "r_x1": 525.6666666666666, - "r_y1": 225.66666666666669, - "r_x2": 532.0, - "r_y2": 225.66666666666669, - "r_x3": 532.0, - "r_y3": 208.0, + "r_x0": 490.33333333333337, + "r_y0": 406.3333333333333, + "r_x1": 490.33333333333337, + "r_y1": 518.3333333333333, + "r_x2": 506.3333333333333, + "r_y2": 518.3333333333333, + "r_x3": 506.3333333333333, + "r_y3": 406.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.9561322, + "confidence": 95.0, "from_ocr": true }, { @@ -927,20 +766,20 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 285.66666666666663, - "r_x1": 525.6666666666666, - "r_y1": 313.0, - "r_x2": 532.0, - "r_y2": 313.0, - "r_x3": 532.0, - "r_y3": 285.66666666666663, + "r_x0": 459.0, + "r_y0": 429.3333333333333, + "r_x1": 459.0, + "r_y1": 499.3333333333333, + "r_x2": 475.0, + "r_y2": 499.3333333333333, + "r_x3": 475.0, + "r_y3": 429.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "some", - "orig": "some", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9615657, + "confidence": 94.0, "from_ocr": true }, { @@ -952,20 +791,20 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 317.0, - "r_x1": 525.6666666666666, - "r_y1": 333.0, - "r_x2": 534.3333333333334, - "r_y2": 333.0, - "r_x3": 534.3333333333334, - "r_y3": 317.0, + "r_x0": 408.0, + "r_y0": 408.3333333333333, + "r_x1": 408.0, + "r_y1": 514.0, + "r_x2": 424.0, + "r_y2": 514.0, + "r_x3": 424.0, + "r_y3": 408.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "cell", - "orig": "cell", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.95838455, + "confidence": 95.0, "from_ocr": true }, { @@ -977,20 +816,20 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 398.3333333333333, - "r_x1": 525.6666666666666, - "r_y1": 422.0, - "r_x2": 534.3333333333334, - "r_y2": 422.0, - "r_x3": 534.3333333333334, - "r_y3": 398.3333333333333, + "r_x0": 376.0, + "r_y0": 440.6666666666667, + "r_x1": 376.0, + "r_y1": 487.6666666666667, + "r_x2": 392.0, + "r_y2": 487.6666666666667, + "r_x3": 392.0, + "r_y3": 440.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9642998500000001, + "confidence": 96.0, "from_ocr": true }, { @@ -1002,20 +841,20 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 426.0, - "r_x1": 525.6666666666666, - "r_y1": 463.0, - "r_x2": 534.0, - "r_y2": 463.0, - "r_x3": 534.0, - "r_y3": 426.0, + "r_x0": 328.0, + "r_y0": 408.3333333333333, + "r_x1": 328.0, + "r_y1": 514.0, + "r_x2": 344.0, + "r_y2": 514.0, + "r_x3": 344.0, + "r_y3": 408.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "content", - "orig": "content", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.96576363, + "confidence": 95.0, "from_ocr": true }, { @@ -1027,135 +866,195 @@ "a": 255 }, "rect": { - "r_x0": 479.3333333333333, - "r_y0": 160.33333333333334, - "r_x1": 479.3333333333333, - "r_y1": 189.33333333333331, - "r_x2": 488.0, - "r_y2": 189.33333333333331, - "r_x3": 488.0, - "r_y3": 160.33333333333334, + "r_x0": 296.6666666666667, + "r_y0": 440.6666666666667, + "r_x1": 296.6666666666667, + "r_y1": 487.6666666666667, + "r_x2": 312.6666666666667, + "r_y2": 487.6666666666667, + "r_x3": 312.6666666666667, + "r_y3": 440.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96371613, - "from_ocr": true - }, - { - "index": 16, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 193.33333333333331, - "r_x1": 479.3333333333333, - "r_y1": 219.0, - "r_x2": 488.0, - "r_y2": 219.0, - "r_x3": 488.0, - "r_y3": 193.33333333333331, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.9634315499999999, - "from_ocr": true - }, - { - "index": 17, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 222.66666666666669, - "r_x1": 479.3333333333333, - "r_y1": 240.33333333333331, - "r_x2": 485.6666666666667, - "r_y2": 240.33333333333331, - "r_x3": 485.6666666666667, - "r_y3": 222.66666666666669, - "coord_origin": "TOPLEFT" - }, - "text": "row", - "orig": "row", - "text_direction": "left_to_right", - "confidence": 0.9611644699999999, - "from_ocr": true - }, - { - "index": 18, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 283.0, - "r_x1": 479.3333333333333, - "r_y1": 309.0, - "r_x2": 487.6666666666667, - "r_y2": 309.0, - "r_x3": 487.6666666666667, - "r_y3": 283.0, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.95751617, - "from_ocr": true - }, - { - "index": 19, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 312.33333333333337, - "r_x1": 479.3333333333333, - "r_y1": 336.33333333333337, - "r_x2": 488.0, - "r_y2": 336.33333333333337, - "r_x3": 488.0, - "r_y3": 312.33333333333337, - "coord_origin": "TOPLEFT" - }, - "text": "don't", - "orig": "don't", - "text_direction": "left_to_right", - "confidence": 0.9581434600000001, + "confidence": 95.0, "from_ocr": true } ], "children": [ + { + "id": 1, + "label": "text", + "bbox": { + "l": 485.66666666666663, + "t": 97.33333333333333, + "r": 506.3333333333333, + "b": 190.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 89.0, + "cells": [ + { + "index": 0, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 485.66666666666663, + "r_y0": 97.33333333333333, + "r_x1": 485.66666666666663, + "r_y1": 190.0, + "r_x2": 506.3333333333333, + "r_y2": 190.0, + "r_x3": 506.3333333333333, + "r_y3": 97.33333333333333, + "coord_origin": "TOPLEFT" + }, + "text": "Vertically", + "orig": "Vertically", + "text_direction": "left_to_right", + "confidence": 89.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 2, + "label": "text", + "bbox": { + "l": 454.33333333333337, + "t": 112.0, + "r": 475.0, + "b": 182.33333333333334, + "coord_origin": "TOPLEFT" + }, + "confidence": 92.0, + "cells": [ + { + "index": 1, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 454.33333333333337, + "r_y0": 112.0, + "r_x1": 454.33333333333337, + "r_y1": 182.33333333333334, + "r_x2": 475.0, + "r_y2": 182.33333333333334, + "r_x3": 475.0, + "r_y3": 112.0, + "coord_origin": "TOPLEFT" + }, + "text": "merged", + "orig": "merged", + "text_direction": "left_to_right", + "confidence": 92.0, + "from_ocr": true + } + ], + "children": [] + }, { "id": 3, "label": "text", "bbox": { - "l": 572.0, - "t": 275.0, - "r": 580.6666666666666, - "b": 343.66666666666663, + "l": 392.0, + "t": 121.66666666666667, + "r": 408.0, + "b": 168.66666666666666, "coord_origin": "TOPLEFT" }, - "confidence": 0.7740143537521362, + "confidence": 95.0, + "cells": [ + { + "index": 2, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 392.0, + "r_y0": 121.66666666666667, + "r_x1": 392.0, + "r_y1": 168.66666666666666, + "r_x2": 408.0, + "r_y2": 168.66666666666666, + "r_x3": 408.0, + "r_y3": 121.66666666666667, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 4, + "label": "text", + "bbox": { + "l": 312.0, + "t": 121.66666666666667, + "r": 328.0, + "b": 168.66666666666666, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ + { + "index": 3, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 312.0, + "r_y0": 121.66666666666667, + "r_x1": 312.0, + "r_y1": 168.66666666666666, + "r_x2": 328.0, + "r_y2": 168.66666666666666, + "r_x3": 328.0, + "r_y3": 121.66666666666667, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 5, + "label": "text", + "bbox": { + "l": 485.66666666666663, + "t": 232.66666666666666, + "r": 506.3333333333333, + "b": 364.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 92.0, "cells": [ { "index": 4, @@ -1166,22 +1065,37 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 275.0, - "r_x1": 572.0, - "r_y1": 304.0, - "r_x2": 580.6666666666666, - "r_y2": 304.0, - "r_x3": 580.6666666666666, - "r_y3": 275.0, + "r_x0": 485.66666666666663, + "r_y0": 232.66666666666666, + "r_x1": 485.66666666666663, + "r_y1": 364.0, + "r_x2": 506.3333333333333, + "r_y2": 364.0, + "r_x3": 506.3333333333333, + "r_y3": 232.66666666666666, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 0.95741158, + "confidence": 92.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 6, + "label": "text", + "bbox": { + "l": 459.0, + "t": 265.66666666666663, + "r": 475.0, + "b": 336.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ { "index": 5, "rgba": { @@ -1191,36 +1105,36 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 308.0, - "r_x1": 572.0, - "r_y1": 343.66666666666663, - "r_x2": 580.3333333333334, - "r_y2": 343.66666666666663, - "r_x3": 580.3333333333334, - "r_y3": 308.0, + "r_x0": 459.0, + "r_y0": 265.66666666666663, + "r_x1": 459.0, + "r_y1": 336.0, + "r_x2": 475.0, + "r_y2": 336.0, + "r_x3": 475.0, + "r_y3": 265.66666666666663, "coord_origin": "TOPLEFT" }, "text": "column", "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9541709899999999, + "confidence": 94.0, "from_ocr": true } ], "children": [] }, { - "id": 1, + "id": 7, "label": "text", "bbox": { - "l": 572.0, - "t": 381.3333333333333, - "r": 580.6666666666666, - "b": 479.3333333333333, + "l": 408.0, + "t": 247.0, + "r": 424.0, + "b": 349.6666666666667, "coord_origin": "TOPLEFT" }, - "confidence": 0.7769111394882202, + "confidence": 89.0, "cells": [ { "index": 6, @@ -1231,22 +1145,37 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 381.3333333333333, - "r_x1": 572.0, - "r_y1": 410.3333333333333, - "r_x2": 580.6666666666666, - "r_y2": 410.3333333333333, - "r_x3": 580.6666666666666, - "r_y3": 381.3333333333333, + "r_x0": 408.0, + "r_y0": 247.0, + "r_x1": 408.0, + "r_y1": 349.6666666666667, + "r_x2": 424.0, + "r_y2": 349.6666666666667, + "r_x3": 424.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.96515053, + "confidence": 89.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 8, + "label": "text", + "bbox": { + "l": 376.0, + "t": 277.0, + "r": 392.0, + "b": 324.3333333333333, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ { "index": 7, "rgba": { @@ -1256,22 +1185,37 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 414.3333333333333, - "r_x1": 572.0, - "r_y1": 440.3333333333333, - "r_x2": 580.3333333333334, - "r_y2": 440.3333333333333, - "r_x3": 580.3333333333334, - "r_y3": 414.3333333333333, + "r_x0": 376.0, + "r_y0": 277.0, + "r_x1": 376.0, + "r_y1": 324.3333333333333, + "r_x2": 392.0, + "r_y2": 324.3333333333333, + "r_x3": 392.0, + "r_y3": 277.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9623101, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 9, + "label": "text", + "bbox": { + "l": 328.0, + "t": 247.0, + "r": 344.0, + "b": 349.6666666666667, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 8, "rgba": { @@ -1281,36 +1225,36 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 443.3333333333333, - "r_x1": 572.0, - "r_y1": 479.3333333333333, - "r_x2": 580.3333333333334, - "r_y2": 479.3333333333333, - "r_x3": 580.3333333333334, - "r_y3": 443.3333333333333, + "r_x0": 328.0, + "r_y0": 247.0, + "r_x1": 328.0, + "r_y1": 349.6666666666667, + "r_x2": 344.0, + "r_y2": 349.6666666666667, + "r_x3": 344.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.94704376, + "confidence": 95.0, "from_ocr": true } ], "children": [] }, { - "id": 6, + "id": 10, "label": "text", "bbox": { - "l": 525.6666666666666, - "t": 175.0, - "r": 534.3333333333334, - "b": 225.66666666666669, + "l": 296.6666666666667, + "t": 277.33333333333337, + "r": 312.6666666666667, + "b": 324.3333333333333, "coord_origin": "TOPLEFT" }, - "confidence": 0.7583935856819153, + "confidence": 96.0, "cells": [ { "index": 9, @@ -1321,22 +1265,37 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 175.0, - "r_x1": 525.6666666666666, - "r_y1": 204.0, - "r_x2": 534.3333333333334, - "r_y2": 204.0, - "r_x3": 534.3333333333334, - "r_y3": 175.0, + "r_x0": 296.6666666666667, + "r_y0": 277.33333333333337, + "r_x1": 296.6666666666667, + "r_y1": 324.3333333333333, + "r_x2": 312.6666666666667, + "r_y2": 324.3333333333333, + "r_x3": 312.6666666666667, + "r_y3": 277.33333333333337, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96139633, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 11, + "label": "text", + "bbox": { + "l": 490.33333333333337, + "t": 406.3333333333333, + "r": 506.3333333333333, + "b": 518.3333333333333, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 10, "rgba": { @@ -1346,36 +1305,36 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 208.0, - "r_x1": 525.6666666666666, - "r_y1": 225.66666666666669, - "r_x2": 532.0, - "r_y2": 225.66666666666669, - "r_x3": 532.0, - "r_y3": 208.0, + "r_x0": 490.33333333333337, + "r_y0": 406.3333333333333, + "r_x1": 490.33333333333337, + "r_y1": 518.3333333333333, + "r_x2": 506.3333333333333, + "r_y2": 518.3333333333333, + "r_x3": 506.3333333333333, + "r_y3": 406.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.9561322, + "confidence": 95.0, "from_ocr": true } ], "children": [] }, { - "id": 2, + "id": 12, "label": "text", "bbox": { - "l": 525.6666666666666, - "t": 285.66666666666663, - "r": 534.3333333333334, - "b": 333.0, + "l": 459.0, + "t": 429.3333333333333, + "r": 475.0, + "b": 499.3333333333333, "coord_origin": "TOPLEFT" }, - "confidence": 0.7750864028930664, + "confidence": 94.0, "cells": [ { "index": 11, @@ -1386,22 +1345,37 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 285.66666666666663, - "r_x1": 525.6666666666666, - "r_y1": 313.0, - "r_x2": 532.0, - "r_y2": 313.0, - "r_x3": 532.0, - "r_y3": 285.66666666666663, + "r_x0": 459.0, + "r_y0": 429.3333333333333, + "r_x1": 459.0, + "r_y1": 499.3333333333333, + "r_x2": 475.0, + "r_y2": 499.3333333333333, + "r_x3": 475.0, + "r_y3": 429.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "some", - "orig": "some", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9615657, + "confidence": 94.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 13, + "label": "text", + "bbox": { + "l": 408.0, + "t": 408.3333333333333, + "r": 424.0, + "b": 514.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 12, "rgba": { @@ -1411,36 +1385,36 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 317.0, - "r_x1": 525.6666666666666, - "r_y1": 333.0, - "r_x2": 534.3333333333334, - "r_y2": 333.0, - "r_x3": 534.3333333333334, - "r_y3": 317.0, + "r_x0": 408.0, + "r_y0": 408.3333333333333, + "r_x1": 408.0, + "r_y1": 514.0, + "r_x2": 424.0, + "r_y2": 514.0, + "r_x3": 424.0, + "r_y3": 408.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "cell", - "orig": "cell", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.95838455, + "confidence": 95.0, "from_ocr": true } ], "children": [] }, { - "id": 7, + "id": 14, "label": "text", "bbox": { - "l": 525.6666666666666, - "t": 398.3333333333333, - "r": 534.3333333333334, - "b": 463.0, + "l": 376.0, + "t": 440.6666666666667, + "r": 392.0, + "b": 487.6666666666667, "coord_origin": "TOPLEFT" }, - "confidence": 0.7514549493789673, + "confidence": 96.0, "cells": [ { "index": 13, @@ -1451,22 +1425,37 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 398.3333333333333, - "r_x1": 525.6666666666666, - "r_y1": 422.0, - "r_x2": 534.3333333333334, - "r_y2": 422.0, - "r_x3": 534.3333333333334, - "r_y3": 398.3333333333333, + "r_x0": 376.0, + "r_y0": 440.6666666666667, + "r_x1": 376.0, + "r_y1": 487.6666666666667, + "r_x2": 392.0, + "r_y2": 487.6666666666667, + "r_x3": 392.0, + "r_y3": 440.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9642998500000001, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 15, + "label": "text", + "bbox": { + "l": 328.0, + "t": 408.3333333333333, + "r": 344.0, + "b": 514.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 14, "rgba": { @@ -1476,36 +1465,36 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 426.0, - "r_x1": 525.6666666666666, - "r_y1": 463.0, - "r_x2": 534.0, - "r_y2": 463.0, - "r_x3": 534.0, - "r_y3": 426.0, + "r_x0": 328.0, + "r_y0": 408.3333333333333, + "r_x1": 328.0, + "r_y1": 514.0, + "r_x2": 344.0, + "r_y2": 514.0, + "r_x3": 344.0, + "r_y3": 408.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "content", - "orig": "content", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.96576363, + "confidence": 95.0, "from_ocr": true } ], "children": [] }, { - "id": 4, + "id": 16, "label": "text", "bbox": { - "l": 479.3333333333333, - "t": 160.33333333333334, - "r": 488.0, - "b": 240.33333333333331, + "l": 296.6666666666667, + "t": 440.6666666666667, + "r": 312.6666666666667, + "b": 487.6666666666667, "coord_origin": "TOPLEFT" }, - "confidence": 0.769959032535553, + "confidence": 95.0, "cells": [ { "index": 15, @@ -1516,135 +1505,20 @@ "a": 255 }, "rect": { - "r_x0": 479.3333333333333, - "r_y0": 160.33333333333334, - "r_x1": 479.3333333333333, - "r_y1": 189.33333333333331, - "r_x2": 488.0, - "r_y2": 189.33333333333331, - "r_x3": 488.0, - "r_y3": 160.33333333333334, + "r_x0": 296.6666666666667, + "r_y0": 440.6666666666667, + "r_x1": 296.6666666666667, + "r_y1": 487.6666666666667, + "r_x2": 312.6666666666667, + "r_y2": 487.6666666666667, + "r_x3": 312.6666666666667, + "r_y3": 440.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96371613, - "from_ocr": true - }, - { - "index": 16, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 193.33333333333331, - "r_x1": 479.3333333333333, - "r_y1": 219.0, - "r_x2": 488.0, - "r_y2": 219.0, - "r_x3": 488.0, - "r_y3": 193.33333333333331, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.9634315499999999, - "from_ocr": true - }, - { - "index": 17, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 222.66666666666669, - "r_x1": 479.3333333333333, - "r_y1": 240.33333333333331, - "r_x2": 485.6666666666667, - "r_y2": 240.33333333333331, - "r_x3": 485.6666666666667, - "r_y3": 222.66666666666669, - "coord_origin": "TOPLEFT" - }, - "text": "row", - "orig": "row", - "text_direction": "left_to_right", - "confidence": 0.9611644699999999, - "from_ocr": true - } - ], - "children": [] - }, - { - "id": 5, - "label": "text", - "bbox": { - "l": 479.3333333333333, - "t": 283.0, - "r": 488.0, - "b": 336.33333333333337, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.7653545141220093, - "cells": [ - { - "index": 18, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 283.0, - "r_x1": 479.3333333333333, - "r_y1": 309.0, - "r_x2": 487.6666666666667, - "r_y2": 309.0, - "r_x3": 487.6666666666667, - "r_y3": 283.0, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.95751617, - "from_ocr": true - }, - { - "index": 19, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 312.33333333333337, - "r_x1": 479.3333333333333, - "r_y1": 336.33333333333337, - "r_x2": 488.0, - "r_y2": 336.33333333333337, - "r_x3": 488.0, - "r_y3": 312.33333333333337, - "coord_origin": "TOPLEFT" - }, - "text": "don't", - "orig": "don't", - "text_direction": "left_to_right", - "confidence": 0.9581434600000001, + "confidence": 95.0, "from_ocr": true } ], @@ -1656,22 +1530,122 @@ }, "tablestructure": { "table_map": { - "11": { + "0": { "label": "table", - "id": 11, + "id": 0, "page_no": 0, "cluster": { - "id": 11, + "id": 0, "label": "table", "bbox": { - "l": 460.5577697753906, - "t": 142.614013671875, - "r": 599.0364074707031, - "b": 499.7825622558594, + "l": 277.4178771972656, + "t": 69.0385971069336, + "r": 524.3541717529297, + "b": 551.0978393554688, "coord_origin": "TOPLEFT" }, - "confidence": 0.5623787045478821, + "confidence": 0.9790208339691162, "cells": [ + { + "index": 0, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 485.66666666666663, + "r_y0": 97.33333333333333, + "r_x1": 485.66666666666663, + "r_y1": 190.0, + "r_x2": 506.3333333333333, + "r_y2": 190.0, + "r_x3": 506.3333333333333, + "r_y3": 97.33333333333333, + "coord_origin": "TOPLEFT" + }, + "text": "Vertically", + "orig": "Vertically", + "text_direction": "left_to_right", + "confidence": 89.0, + "from_ocr": true + }, + { + "index": 1, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 454.33333333333337, + "r_y0": 112.0, + "r_x1": 454.33333333333337, + "r_y1": 182.33333333333334, + "r_x2": 475.0, + "r_y2": 182.33333333333334, + "r_x3": 475.0, + "r_y3": 112.0, + "coord_origin": "TOPLEFT" + }, + "text": "merged", + "orig": "merged", + "text_direction": "left_to_right", + "confidence": 92.0, + "from_ocr": true + }, + { + "index": 2, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 392.0, + "r_y0": 121.66666666666667, + "r_x1": 392.0, + "r_y1": 168.66666666666666, + "r_x2": 408.0, + "r_y2": 168.66666666666666, + "r_x3": 408.0, + "r_y3": 121.66666666666667, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 3, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 312.0, + "r_y0": 121.66666666666667, + "r_x1": 312.0, + "r_y1": 168.66666666666666, + "r_x2": 328.0, + "r_y2": 168.66666666666666, + "r_x3": 328.0, + "r_y3": 121.66666666666667, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + }, { "index": 4, "rgba": { @@ -1681,20 +1655,20 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 275.0, - "r_x1": 572.0, - "r_y1": 304.0, - "r_x2": 580.6666666666666, - "r_y2": 304.0, - "r_x3": 580.6666666666666, - "r_y3": 275.0, + "r_x0": 485.66666666666663, + "r_y0": 232.66666666666666, + "r_x1": 485.66666666666663, + "r_y1": 364.0, + "r_x2": 506.3333333333333, + "r_y2": 364.0, + "r_x3": 506.3333333333333, + "r_y3": 232.66666666666666, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 0.95741158, + "confidence": 92.0, "from_ocr": true }, { @@ -1706,20 +1680,20 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 308.0, - "r_x1": 572.0, - "r_y1": 343.66666666666663, - "r_x2": 580.3333333333334, - "r_y2": 343.66666666666663, - "r_x3": 580.3333333333334, - "r_y3": 308.0, + "r_x0": 459.0, + "r_y0": 265.66666666666663, + "r_x1": 459.0, + "r_y1": 336.0, + "r_x2": 475.0, + "r_y2": 336.0, + "r_x3": 475.0, + "r_y3": 265.66666666666663, "coord_origin": "TOPLEFT" }, "text": "column", "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9541709899999999, + "confidence": 94.0, "from_ocr": true }, { @@ -1731,20 +1705,20 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 381.3333333333333, - "r_x1": 572.0, - "r_y1": 410.3333333333333, - "r_x2": 580.6666666666666, - "r_y2": 410.3333333333333, - "r_x3": 580.6666666666666, - "r_y3": 381.3333333333333, + "r_x0": 408.0, + "r_y0": 247.0, + "r_x1": 408.0, + "r_y1": 349.6666666666667, + "r_x2": 424.0, + "r_y2": 349.6666666666667, + "r_x3": 424.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.96515053, + "confidence": 89.0, "from_ocr": true }, { @@ -1756,20 +1730,20 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 414.3333333333333, - "r_x1": 572.0, - "r_y1": 440.3333333333333, - "r_x2": 580.3333333333334, - "r_y2": 440.3333333333333, - "r_x3": 580.3333333333334, - "r_y3": 414.3333333333333, + "r_x0": 376.0, + "r_y0": 277.0, + "r_x1": 376.0, + "r_y1": 324.3333333333333, + "r_x2": 392.0, + "r_y2": 324.3333333333333, + "r_x3": 392.0, + "r_y3": 277.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9623101, + "confidence": 96.0, "from_ocr": true }, { @@ -1781,20 +1755,20 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 443.3333333333333, - "r_x1": 572.0, - "r_y1": 479.3333333333333, - "r_x2": 580.3333333333334, - "r_y2": 479.3333333333333, - "r_x3": 580.3333333333334, - "r_y3": 443.3333333333333, + "r_x0": 328.0, + "r_y0": 247.0, + "r_x1": 328.0, + "r_y1": 349.6666666666667, + "r_x2": 344.0, + "r_y2": 349.6666666666667, + "r_x3": 344.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.94704376, + "confidence": 95.0, "from_ocr": true }, { @@ -1806,20 +1780,20 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 175.0, - "r_x1": 525.6666666666666, - "r_y1": 204.0, - "r_x2": 534.3333333333334, - "r_y2": 204.0, - "r_x3": 534.3333333333334, - "r_y3": 175.0, + "r_x0": 296.6666666666667, + "r_y0": 277.33333333333337, + "r_x1": 296.6666666666667, + "r_y1": 324.3333333333333, + "r_x2": 312.6666666666667, + "r_y2": 324.3333333333333, + "r_x3": 312.6666666666667, + "r_y3": 277.33333333333337, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96139633, + "confidence": 96.0, "from_ocr": true }, { @@ -1831,20 +1805,20 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 208.0, - "r_x1": 525.6666666666666, - "r_y1": 225.66666666666669, - "r_x2": 532.0, - "r_y2": 225.66666666666669, - "r_x3": 532.0, - "r_y3": 208.0, + "r_x0": 490.33333333333337, + "r_y0": 406.3333333333333, + "r_x1": 490.33333333333337, + "r_y1": 518.3333333333333, + "r_x2": 506.3333333333333, + "r_y2": 518.3333333333333, + "r_x3": 506.3333333333333, + "r_y3": 406.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.9561322, + "confidence": 95.0, "from_ocr": true }, { @@ -1856,20 +1830,20 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 285.66666666666663, - "r_x1": 525.6666666666666, - "r_y1": 313.0, - "r_x2": 532.0, - "r_y2": 313.0, - "r_x3": 532.0, - "r_y3": 285.66666666666663, + "r_x0": 459.0, + "r_y0": 429.3333333333333, + "r_x1": 459.0, + "r_y1": 499.3333333333333, + "r_x2": 475.0, + "r_y2": 499.3333333333333, + "r_x3": 475.0, + "r_y3": 429.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "some", - "orig": "some", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9615657, + "confidence": 94.0, "from_ocr": true }, { @@ -1881,20 +1855,20 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 317.0, - "r_x1": 525.6666666666666, - "r_y1": 333.0, - "r_x2": 534.3333333333334, - "r_y2": 333.0, - "r_x3": 534.3333333333334, - "r_y3": 317.0, + "r_x0": 408.0, + "r_y0": 408.3333333333333, + "r_x1": 408.0, + "r_y1": 514.0, + "r_x2": 424.0, + "r_y2": 514.0, + "r_x3": 424.0, + "r_y3": 408.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "cell", - "orig": "cell", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.95838455, + "confidence": 95.0, "from_ocr": true }, { @@ -1906,20 +1880,20 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 398.3333333333333, - "r_x1": 525.6666666666666, - "r_y1": 422.0, - "r_x2": 534.3333333333334, - "r_y2": 422.0, - "r_x3": 534.3333333333334, - "r_y3": 398.3333333333333, + "r_x0": 376.0, + "r_y0": 440.6666666666667, + "r_x1": 376.0, + "r_y1": 487.6666666666667, + "r_x2": 392.0, + "r_y2": 487.6666666666667, + "r_x3": 392.0, + "r_y3": 440.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9642998500000001, + "confidence": 96.0, "from_ocr": true }, { @@ -1931,20 +1905,20 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 426.0, - "r_x1": 525.6666666666666, - "r_y1": 463.0, - "r_x2": 534.0, - "r_y2": 463.0, - "r_x3": 534.0, - "r_y3": 426.0, + "r_x0": 328.0, + "r_y0": 408.3333333333333, + "r_x1": 328.0, + "r_y1": 514.0, + "r_x2": 344.0, + "r_y2": 514.0, + "r_x3": 344.0, + "r_y3": 408.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "content", - "orig": "content", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.96576363, + "confidence": 95.0, "from_ocr": true }, { @@ -1956,135 +1930,195 @@ "a": 255 }, "rect": { - "r_x0": 479.3333333333333, - "r_y0": 160.33333333333334, - "r_x1": 479.3333333333333, - "r_y1": 189.33333333333331, - "r_x2": 488.0, - "r_y2": 189.33333333333331, - "r_x3": 488.0, - "r_y3": 160.33333333333334, + "r_x0": 296.6666666666667, + "r_y0": 440.6666666666667, + "r_x1": 296.6666666666667, + "r_y1": 487.6666666666667, + "r_x2": 312.6666666666667, + "r_y2": 487.6666666666667, + "r_x3": 312.6666666666667, + "r_y3": 440.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96371613, - "from_ocr": true - }, - { - "index": 16, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 193.33333333333331, - "r_x1": 479.3333333333333, - "r_y1": 219.0, - "r_x2": 488.0, - "r_y2": 219.0, - "r_x3": 488.0, - "r_y3": 193.33333333333331, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.9634315499999999, - "from_ocr": true - }, - { - "index": 17, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 222.66666666666669, - "r_x1": 479.3333333333333, - "r_y1": 240.33333333333331, - "r_x2": 485.6666666666667, - "r_y2": 240.33333333333331, - "r_x3": 485.6666666666667, - "r_y3": 222.66666666666669, - "coord_origin": "TOPLEFT" - }, - "text": "row", - "orig": "row", - "text_direction": "left_to_right", - "confidence": 0.9611644699999999, - "from_ocr": true - }, - { - "index": 18, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 283.0, - "r_x1": 479.3333333333333, - "r_y1": 309.0, - "r_x2": 487.6666666666667, - "r_y2": 309.0, - "r_x3": 487.6666666666667, - "r_y3": 283.0, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.95751617, - "from_ocr": true - }, - { - "index": 19, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 312.33333333333337, - "r_x1": 479.3333333333333, - "r_y1": 336.33333333333337, - "r_x2": 488.0, - "r_y2": 336.33333333333337, - "r_x3": 488.0, - "r_y3": 312.33333333333337, - "coord_origin": "TOPLEFT" - }, - "text": "don't", - "orig": "don't", - "text_direction": "left_to_right", - "confidence": 0.9581434600000001, + "confidence": 95.0, "from_ocr": true } ], "children": [ + { + "id": 1, + "label": "text", + "bbox": { + "l": 485.66666666666663, + "t": 97.33333333333333, + "r": 506.3333333333333, + "b": 190.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 89.0, + "cells": [ + { + "index": 0, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 485.66666666666663, + "r_y0": 97.33333333333333, + "r_x1": 485.66666666666663, + "r_y1": 190.0, + "r_x2": 506.3333333333333, + "r_y2": 190.0, + "r_x3": 506.3333333333333, + "r_y3": 97.33333333333333, + "coord_origin": "TOPLEFT" + }, + "text": "Vertically", + "orig": "Vertically", + "text_direction": "left_to_right", + "confidence": 89.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 2, + "label": "text", + "bbox": { + "l": 454.33333333333337, + "t": 112.0, + "r": 475.0, + "b": 182.33333333333334, + "coord_origin": "TOPLEFT" + }, + "confidence": 92.0, + "cells": [ + { + "index": 1, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 454.33333333333337, + "r_y0": 112.0, + "r_x1": 454.33333333333337, + "r_y1": 182.33333333333334, + "r_x2": 475.0, + "r_y2": 182.33333333333334, + "r_x3": 475.0, + "r_y3": 112.0, + "coord_origin": "TOPLEFT" + }, + "text": "merged", + "orig": "merged", + "text_direction": "left_to_right", + "confidence": 92.0, + "from_ocr": true + } + ], + "children": [] + }, { "id": 3, "label": "text", "bbox": { - "l": 572.0, - "t": 275.0, - "r": 580.6666666666666, - "b": 343.66666666666663, + "l": 392.0, + "t": 121.66666666666667, + "r": 408.0, + "b": 168.66666666666666, "coord_origin": "TOPLEFT" }, - "confidence": 0.7740143537521362, + "confidence": 95.0, + "cells": [ + { + "index": 2, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 392.0, + "r_y0": 121.66666666666667, + "r_x1": 392.0, + "r_y1": 168.66666666666666, + "r_x2": 408.0, + "r_y2": 168.66666666666666, + "r_x3": 408.0, + "r_y3": 121.66666666666667, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 4, + "label": "text", + "bbox": { + "l": 312.0, + "t": 121.66666666666667, + "r": 328.0, + "b": 168.66666666666666, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ + { + "index": 3, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 312.0, + "r_y0": 121.66666666666667, + "r_x1": 312.0, + "r_y1": 168.66666666666666, + "r_x2": 328.0, + "r_y2": 168.66666666666666, + "r_x3": 328.0, + "r_y3": 121.66666666666667, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 5, + "label": "text", + "bbox": { + "l": 485.66666666666663, + "t": 232.66666666666666, + "r": 506.3333333333333, + "b": 364.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 92.0, "cells": [ { "index": 4, @@ -2095,22 +2129,37 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 275.0, - "r_x1": 572.0, - "r_y1": 304.0, - "r_x2": 580.6666666666666, - "r_y2": 304.0, - "r_x3": 580.6666666666666, - "r_y3": 275.0, + "r_x0": 485.66666666666663, + "r_y0": 232.66666666666666, + "r_x1": 485.66666666666663, + "r_y1": 364.0, + "r_x2": 506.3333333333333, + "r_y2": 364.0, + "r_x3": 506.3333333333333, + "r_y3": 232.66666666666666, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 0.95741158, + "confidence": 92.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 6, + "label": "text", + "bbox": { + "l": 459.0, + "t": 265.66666666666663, + "r": 475.0, + "b": 336.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ { "index": 5, "rgba": { @@ -2120,36 +2169,36 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 308.0, - "r_x1": 572.0, - "r_y1": 343.66666666666663, - "r_x2": 580.3333333333334, - "r_y2": 343.66666666666663, - "r_x3": 580.3333333333334, - "r_y3": 308.0, + "r_x0": 459.0, + "r_y0": 265.66666666666663, + "r_x1": 459.0, + "r_y1": 336.0, + "r_x2": 475.0, + "r_y2": 336.0, + "r_x3": 475.0, + "r_y3": 265.66666666666663, "coord_origin": "TOPLEFT" }, "text": "column", "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9541709899999999, + "confidence": 94.0, "from_ocr": true } ], "children": [] }, { - "id": 1, + "id": 7, "label": "text", "bbox": { - "l": 572.0, - "t": 381.3333333333333, - "r": 580.6666666666666, - "b": 479.3333333333333, + "l": 408.0, + "t": 247.0, + "r": 424.0, + "b": 349.6666666666667, "coord_origin": "TOPLEFT" }, - "confidence": 0.7769111394882202, + "confidence": 89.0, "cells": [ { "index": 6, @@ -2160,22 +2209,37 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 381.3333333333333, - "r_x1": 572.0, - "r_y1": 410.3333333333333, - "r_x2": 580.6666666666666, - "r_y2": 410.3333333333333, - "r_x3": 580.6666666666666, - "r_y3": 381.3333333333333, + "r_x0": 408.0, + "r_y0": 247.0, + "r_x1": 408.0, + "r_y1": 349.6666666666667, + "r_x2": 424.0, + "r_y2": 349.6666666666667, + "r_x3": 424.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.96515053, + "confidence": 89.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 8, + "label": "text", + "bbox": { + "l": 376.0, + "t": 277.0, + "r": 392.0, + "b": 324.3333333333333, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ { "index": 7, "rgba": { @@ -2185,22 +2249,37 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 414.3333333333333, - "r_x1": 572.0, - "r_y1": 440.3333333333333, - "r_x2": 580.3333333333334, - "r_y2": 440.3333333333333, - "r_x3": 580.3333333333334, - "r_y3": 414.3333333333333, + "r_x0": 376.0, + "r_y0": 277.0, + "r_x1": 376.0, + "r_y1": 324.3333333333333, + "r_x2": 392.0, + "r_y2": 324.3333333333333, + "r_x3": 392.0, + "r_y3": 277.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9623101, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 9, + "label": "text", + "bbox": { + "l": 328.0, + "t": 247.0, + "r": 344.0, + "b": 349.6666666666667, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 8, "rgba": { @@ -2210,36 +2289,36 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 443.3333333333333, - "r_x1": 572.0, - "r_y1": 479.3333333333333, - "r_x2": 580.3333333333334, - "r_y2": 479.3333333333333, - "r_x3": 580.3333333333334, - "r_y3": 443.3333333333333, + "r_x0": 328.0, + "r_y0": 247.0, + "r_x1": 328.0, + "r_y1": 349.6666666666667, + "r_x2": 344.0, + "r_y2": 349.6666666666667, + "r_x3": 344.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.94704376, + "confidence": 95.0, "from_ocr": true } ], "children": [] }, { - "id": 6, + "id": 10, "label": "text", "bbox": { - "l": 525.6666666666666, - "t": 175.0, - "r": 534.3333333333334, - "b": 225.66666666666669, + "l": 296.6666666666667, + "t": 277.33333333333337, + "r": 312.6666666666667, + "b": 324.3333333333333, "coord_origin": "TOPLEFT" }, - "confidence": 0.7583935856819153, + "confidence": 96.0, "cells": [ { "index": 9, @@ -2250,22 +2329,37 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 175.0, - "r_x1": 525.6666666666666, - "r_y1": 204.0, - "r_x2": 534.3333333333334, - "r_y2": 204.0, - "r_x3": 534.3333333333334, - "r_y3": 175.0, + "r_x0": 296.6666666666667, + "r_y0": 277.33333333333337, + "r_x1": 296.6666666666667, + "r_y1": 324.3333333333333, + "r_x2": 312.6666666666667, + "r_y2": 324.3333333333333, + "r_x3": 312.6666666666667, + "r_y3": 277.33333333333337, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96139633, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 11, + "label": "text", + "bbox": { + "l": 490.33333333333337, + "t": 406.3333333333333, + "r": 506.3333333333333, + "b": 518.3333333333333, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 10, "rgba": { @@ -2275,36 +2369,36 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 208.0, - "r_x1": 525.6666666666666, - "r_y1": 225.66666666666669, - "r_x2": 532.0, - "r_y2": 225.66666666666669, - "r_x3": 532.0, - "r_y3": 208.0, + "r_x0": 490.33333333333337, + "r_y0": 406.3333333333333, + "r_x1": 490.33333333333337, + "r_y1": 518.3333333333333, + "r_x2": 506.3333333333333, + "r_y2": 518.3333333333333, + "r_x3": 506.3333333333333, + "r_y3": 406.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.9561322, + "confidence": 95.0, "from_ocr": true } ], "children": [] }, { - "id": 2, + "id": 12, "label": "text", "bbox": { - "l": 525.6666666666666, - "t": 285.66666666666663, - "r": 534.3333333333334, - "b": 333.0, + "l": 459.0, + "t": 429.3333333333333, + "r": 475.0, + "b": 499.3333333333333, "coord_origin": "TOPLEFT" }, - "confidence": 0.7750864028930664, + "confidence": 94.0, "cells": [ { "index": 11, @@ -2315,22 +2409,37 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 285.66666666666663, - "r_x1": 525.6666666666666, - "r_y1": 313.0, - "r_x2": 532.0, - "r_y2": 313.0, - "r_x3": 532.0, - "r_y3": 285.66666666666663, + "r_x0": 459.0, + "r_y0": 429.3333333333333, + "r_x1": 459.0, + "r_y1": 499.3333333333333, + "r_x2": 475.0, + "r_y2": 499.3333333333333, + "r_x3": 475.0, + "r_y3": 429.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "some", - "orig": "some", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9615657, + "confidence": 94.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 13, + "label": "text", + "bbox": { + "l": 408.0, + "t": 408.3333333333333, + "r": 424.0, + "b": 514.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 12, "rgba": { @@ -2340,36 +2449,36 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 317.0, - "r_x1": 525.6666666666666, - "r_y1": 333.0, - "r_x2": 534.3333333333334, - "r_y2": 333.0, - "r_x3": 534.3333333333334, - "r_y3": 317.0, + "r_x0": 408.0, + "r_y0": 408.3333333333333, + "r_x1": 408.0, + "r_y1": 514.0, + "r_x2": 424.0, + "r_y2": 514.0, + "r_x3": 424.0, + "r_y3": 408.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "cell", - "orig": "cell", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.95838455, + "confidence": 95.0, "from_ocr": true } ], "children": [] }, { - "id": 7, + "id": 14, "label": "text", "bbox": { - "l": 525.6666666666666, - "t": 398.3333333333333, - "r": 534.3333333333334, - "b": 463.0, + "l": 376.0, + "t": 440.6666666666667, + "r": 392.0, + "b": 487.6666666666667, "coord_origin": "TOPLEFT" }, - "confidence": 0.7514549493789673, + "confidence": 96.0, "cells": [ { "index": 13, @@ -2380,22 +2489,37 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 398.3333333333333, - "r_x1": 525.6666666666666, - "r_y1": 422.0, - "r_x2": 534.3333333333334, - "r_y2": 422.0, - "r_x3": 534.3333333333334, - "r_y3": 398.3333333333333, + "r_x0": 376.0, + "r_y0": 440.6666666666667, + "r_x1": 376.0, + "r_y1": 487.6666666666667, + "r_x2": 392.0, + "r_y2": 487.6666666666667, + "r_x3": 392.0, + "r_y3": 440.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9642998500000001, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 15, + "label": "text", + "bbox": { + "l": 328.0, + "t": 408.3333333333333, + "r": 344.0, + "b": 514.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 14, "rgba": { @@ -2405,36 +2529,36 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 426.0, - "r_x1": 525.6666666666666, - "r_y1": 463.0, - "r_x2": 534.0, - "r_y2": 463.0, - "r_x3": 534.0, - "r_y3": 426.0, + "r_x0": 328.0, + "r_y0": 408.3333333333333, + "r_x1": 328.0, + "r_y1": 514.0, + "r_x2": 344.0, + "r_y2": 514.0, + "r_x3": 344.0, + "r_y3": 408.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "content", - "orig": "content", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.96576363, + "confidence": 95.0, "from_ocr": true } ], "children": [] }, { - "id": 4, + "id": 16, "label": "text", "bbox": { - "l": 479.3333333333333, - "t": 160.33333333333334, - "r": 488.0, - "b": 240.33333333333331, + "l": 296.6666666666667, + "t": 440.6666666666667, + "r": 312.6666666666667, + "b": 487.6666666666667, "coord_origin": "TOPLEFT" }, - "confidence": 0.769959032535553, + "confidence": 95.0, "cells": [ { "index": 15, @@ -2445,135 +2569,20 @@ "a": 255 }, "rect": { - "r_x0": 479.3333333333333, - "r_y0": 160.33333333333334, - "r_x1": 479.3333333333333, - "r_y1": 189.33333333333331, - "r_x2": 488.0, - "r_y2": 189.33333333333331, - "r_x3": 488.0, - "r_y3": 160.33333333333334, + "r_x0": 296.6666666666667, + "r_y0": 440.6666666666667, + "r_x1": 296.6666666666667, + "r_y1": 487.6666666666667, + "r_x2": 312.6666666666667, + "r_y2": 487.6666666666667, + "r_x3": 312.6666666666667, + "r_y3": 440.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96371613, - "from_ocr": true - }, - { - "index": 16, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 193.33333333333331, - "r_x1": 479.3333333333333, - "r_y1": 219.0, - "r_x2": 488.0, - "r_y2": 219.0, - "r_x3": 488.0, - "r_y3": 193.33333333333331, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.9634315499999999, - "from_ocr": true - }, - { - "index": 17, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 222.66666666666669, - "r_x1": 479.3333333333333, - "r_y1": 240.33333333333331, - "r_x2": 485.6666666666667, - "r_y2": 240.33333333333331, - "r_x3": 485.6666666666667, - "r_y3": 222.66666666666669, - "coord_origin": "TOPLEFT" - }, - "text": "row", - "orig": "row", - "text_direction": "left_to_right", - "confidence": 0.9611644699999999, - "from_ocr": true - } - ], - "children": [] - }, - { - "id": 5, - "label": "text", - "bbox": { - "l": 479.3333333333333, - "t": 283.0, - "r": 488.0, - "b": 336.33333333333337, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.7653545141220093, - "cells": [ - { - "index": 18, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 283.0, - "r_x1": 479.3333333333333, - "r_y1": 309.0, - "r_x2": 487.6666666666667, - "r_y2": 309.0, - "r_x3": 487.6666666666667, - "r_y3": 283.0, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.95751617, - "from_ocr": true - }, - { - "index": 19, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 312.33333333333337, - "r_x1": 479.3333333333333, - "r_y1": 336.33333333333337, - "r_x2": 488.0, - "r_y2": 336.33333333333337, - "r_x3": 488.0, - "r_y3": 312.33333333333337, - "coord_origin": "TOPLEFT" - }, - "text": "don't", - "orig": "don't", - "text_direction": "left_to_right", - "confidence": 0.9581434600000001, + "confidence": 95.0, "from_ocr": true } ], @@ -2583,22 +2592,80 @@ }, "text": null, "otsl_seq": [ - "ecel", + "ched", "ched", "ched", "nl", - "rhed", + "fcel", "fcel", "fcel", "nl", - "rhed", "fcel", - "ecel", + "fcel", + "fcel", "nl" ], - "num_rows": 0, - "num_cols": 0, - "table_cells": [] + "num_rows": 1, + "num_cols": 3, + "table_cells": [ + { + "bbox": { + "l": 443.33333333333337, + "t": 312.0, + "r": 490.33333333333337, + "b": 328.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 262.3333333333333, + "t": 296.6666666666667, + "r": 365.0, + "b": 344.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Some other value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 98.0, + "t": 296.6666666666667, + "r": 203.66666666666669, + "b": 344.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 0, + "end_col_offset_idx": 1, + "text": "Yet another value", + "column_header": false, + "row_header": false, + "row_section": false + } + ] } } }, @@ -2609,20 +2676,20 @@ "assembled": { "elements": [ { - "label": "section_header", - "id": 8, + "label": "table", + "id": 0, "page_no": 0, "cluster": { - "id": 8, - "label": "section_header", + "id": 0, + "label": "table", "bbox": { - "l": 690.10272, - "t": 201.26337, - "r": 719.1490499999999, - "b": 417.96024, + "l": 277.4178771972656, + "t": 69.0385971069336, + "r": 524.3541717529297, + "b": 551.0978393554688, "coord_origin": "TOPLEFT" }, - "confidence": 0.7426818609237671, + "confidence": 0.9790208339691162, "cells": [ { "index": 0, @@ -2633,43 +2700,22 @@ "a": 255 }, "rect": { - "r_x0": 690.10272, - "r_y0": 417.96024, - "r_x1": 719.1490499999999, - "r_y1": 417.96024, - "r_x2": 719.1490499999999, - "r_y2": 201.26337, - "r_x3": 690.10272, - "r_y3": 201.26337, + "r_x0": 485.66666666666663, + "r_y0": 97.33333333333333, + "r_x1": 485.66666666666663, + "r_y1": 190.0, + "r_x2": 506.3333333333333, + "r_y2": 190.0, + "r_x3": 506.3333333333333, + "r_y3": 97.33333333333333, "coord_origin": "TOPLEFT" }, - "text": "This is a table test ", - "orig": "This is a table test ", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - } - ], - "children": [] - }, - "text": "This is a table test" - }, - { - "label": "picture", - "id": 13, - "page_no": 0, - "cluster": { - "id": 13, - "label": "picture", - "bbox": { - "l": 668.9778442382812, - "t": 70.57099151611328, - "r": 683.4164962768555, - "b": 79.46605682373047, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.5229994654655457, - "cells": [ + "confidence": 89.0, + "from_ocr": true + }, { "index": 1, "rgba": { @@ -2679,88 +2725,22 @@ "a": 255 }, "rect": { - "r_x0": 669.96899, - "r_y0": 78.71936000000005, - "r_x1": 682.25806, - "r_y1": 78.71936000000005, - "r_x2": 682.25806, - "r_y2": 71.99987999999996, - "r_x3": 669.96899, - "r_y3": 71.99987999999996, + "r_x0": 454.33333333333337, + "r_y0": 112.0, + "r_x1": 454.33333333333337, + "r_y1": 182.33333333333334, + "r_x2": 475.0, + "r_y2": 182.33333333333334, + "r_x3": 475.0, + "r_y3": 112.0, "coord_origin": "TOPLEFT" }, - "text": " T", - "orig": " T", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - } - ], - "children": [ - { - "id": 20, - "label": "text", - "bbox": { - "l": 669.96899, - "t": 71.99987999999996, - "r": 682.25806, - "b": 78.71936000000005, - "coord_origin": "TOPLEFT" - }, - "confidence": 1.0, - "cells": [ - { - "index": 1, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 669.96899, - "r_y0": 78.71936000000005, - "r_x1": 682.25806, - "r_y1": 78.71936000000005, - "r_x2": 682.25806, - "r_y2": 71.99987999999996, - "r_x3": 669.96899, - "r_y3": 71.99987999999996, - "coord_origin": "TOPLEFT" - }, - "text": " T", - "orig": " T", - "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - } - ], - "children": [] - } - ] - }, - "text": "", - "annotations": [], - "provenance": null, - "predicted_class": null, - "confidence": null - }, - { - "label": "text", - "id": 0, - "page_no": 0, - "cluster": { - "id": 0, - "label": "text", - "bbox": { - "l": 640.87671, - "t": 78.71447999999998, - "r": 653.16504, - "b": 376.27319, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.8302523493766785, - "cells": [ + "confidence": 92.0, + "from_ocr": true + }, { "index": 2, "rgba": { @@ -2770,43 +2750,47 @@ "a": 255 }, "rect": { - "r_x0": 640.87671, - "r_y0": 376.27319, - "r_x1": 653.16504, - "r_y1": 376.27319, - "r_x2": 653.16504, - "r_y2": 78.71447999999998, - "r_x3": 640.87671, - "r_y3": 78.71447999999998, + "r_x0": 392.0, + "r_y0": 121.66666666666667, + "r_x1": 392.0, + "r_y1": 168.66666666666666, + "r_x2": 408.0, + "r_y2": 168.66666666666666, + "r_x3": 408.0, + "r_y3": 121.66666666666667, "coord_origin": "TOPLEFT" }, - "text": "heteststartswithsomerandomtextandthenatableimage: ", - "orig": "heteststartswithsomerandomtextandthenatableimage: ", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - } - ], - "children": [] - }, - "text": "heteststartswithsomerandomtextandthenatableimage:" - }, - { - "label": "table", - "id": 11, - "page_no": 0, - "cluster": { - "id": 11, - "label": "table", - "bbox": { - "l": 460.5577697753906, - "t": 142.614013671875, - "r": 599.0364074707031, - "b": 499.7825622558594, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.5623787045478821, - "cells": [ + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 3, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 312.0, + "r_y0": 121.66666666666667, + "r_x1": 312.0, + "r_y1": 168.66666666666666, + "r_x2": 328.0, + "r_y2": 168.66666666666666, + "r_x3": 328.0, + "r_y3": 121.66666666666667, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + }, { "index": 4, "rgba": { @@ -2816,20 +2800,20 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 275.0, - "r_x1": 572.0, - "r_y1": 304.0, - "r_x2": 580.6666666666666, - "r_y2": 304.0, - "r_x3": 580.6666666666666, - "r_y3": 275.0, + "r_x0": 485.66666666666663, + "r_y0": 232.66666666666666, + "r_x1": 485.66666666666663, + "r_y1": 364.0, + "r_x2": 506.3333333333333, + "r_y2": 364.0, + "r_x3": 506.3333333333333, + "r_y3": 232.66666666666666, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 0.95741158, + "confidence": 92.0, "from_ocr": true }, { @@ -2841,20 +2825,20 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 308.0, - "r_x1": 572.0, - "r_y1": 343.66666666666663, - "r_x2": 580.3333333333334, - "r_y2": 343.66666666666663, - "r_x3": 580.3333333333334, - "r_y3": 308.0, + "r_x0": 459.0, + "r_y0": 265.66666666666663, + "r_x1": 459.0, + "r_y1": 336.0, + "r_x2": 475.0, + "r_y2": 336.0, + "r_x3": 475.0, + "r_y3": 265.66666666666663, "coord_origin": "TOPLEFT" }, "text": "column", "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9541709899999999, + "confidence": 94.0, "from_ocr": true }, { @@ -2866,20 +2850,20 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 381.3333333333333, - "r_x1": 572.0, - "r_y1": 410.3333333333333, - "r_x2": 580.6666666666666, - "r_y2": 410.3333333333333, - "r_x3": 580.6666666666666, - "r_y3": 381.3333333333333, + "r_x0": 408.0, + "r_y0": 247.0, + "r_x1": 408.0, + "r_y1": 349.6666666666667, + "r_x2": 424.0, + "r_y2": 349.6666666666667, + "r_x3": 424.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.96515053, + "confidence": 89.0, "from_ocr": true }, { @@ -2891,20 +2875,20 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 414.3333333333333, - "r_x1": 572.0, - "r_y1": 440.3333333333333, - "r_x2": 580.3333333333334, - "r_y2": 440.3333333333333, - "r_x3": 580.3333333333334, - "r_y3": 414.3333333333333, + "r_x0": 376.0, + "r_y0": 277.0, + "r_x1": 376.0, + "r_y1": 324.3333333333333, + "r_x2": 392.0, + "r_y2": 324.3333333333333, + "r_x3": 392.0, + "r_y3": 277.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9623101, + "confidence": 96.0, "from_ocr": true }, { @@ -2916,20 +2900,20 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 443.3333333333333, - "r_x1": 572.0, - "r_y1": 479.3333333333333, - "r_x2": 580.3333333333334, - "r_y2": 479.3333333333333, - "r_x3": 580.3333333333334, - "r_y3": 443.3333333333333, + "r_x0": 328.0, + "r_y0": 247.0, + "r_x1": 328.0, + "r_y1": 349.6666666666667, + "r_x2": 344.0, + "r_y2": 349.6666666666667, + "r_x3": 344.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.94704376, + "confidence": 95.0, "from_ocr": true }, { @@ -2941,20 +2925,20 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 175.0, - "r_x1": 525.6666666666666, - "r_y1": 204.0, - "r_x2": 534.3333333333334, - "r_y2": 204.0, - "r_x3": 534.3333333333334, - "r_y3": 175.0, + "r_x0": 296.6666666666667, + "r_y0": 277.33333333333337, + "r_x1": 296.6666666666667, + "r_y1": 324.3333333333333, + "r_x2": 312.6666666666667, + "r_y2": 324.3333333333333, + "r_x3": 312.6666666666667, + "r_y3": 277.33333333333337, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96139633, + "confidence": 96.0, "from_ocr": true }, { @@ -2966,20 +2950,20 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 208.0, - "r_x1": 525.6666666666666, - "r_y1": 225.66666666666669, - "r_x2": 532.0, - "r_y2": 225.66666666666669, - "r_x3": 532.0, - "r_y3": 208.0, + "r_x0": 490.33333333333337, + "r_y0": 406.3333333333333, + "r_x1": 490.33333333333337, + "r_y1": 518.3333333333333, + "r_x2": 506.3333333333333, + "r_y2": 518.3333333333333, + "r_x3": 506.3333333333333, + "r_y3": 406.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.9561322, + "confidence": 95.0, "from_ocr": true }, { @@ -2991,20 +2975,20 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 285.66666666666663, - "r_x1": 525.6666666666666, - "r_y1": 313.0, - "r_x2": 532.0, - "r_y2": 313.0, - "r_x3": 532.0, - "r_y3": 285.66666666666663, + "r_x0": 459.0, + "r_y0": 429.3333333333333, + "r_x1": 459.0, + "r_y1": 499.3333333333333, + "r_x2": 475.0, + "r_y2": 499.3333333333333, + "r_x3": 475.0, + "r_y3": 429.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "some", - "orig": "some", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9615657, + "confidence": 94.0, "from_ocr": true }, { @@ -3016,20 +3000,20 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 317.0, - "r_x1": 525.6666666666666, - "r_y1": 333.0, - "r_x2": 534.3333333333334, - "r_y2": 333.0, - "r_x3": 534.3333333333334, - "r_y3": 317.0, + "r_x0": 408.0, + "r_y0": 408.3333333333333, + "r_x1": 408.0, + "r_y1": 514.0, + "r_x2": 424.0, + "r_y2": 514.0, + "r_x3": 424.0, + "r_y3": 408.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "cell", - "orig": "cell", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.95838455, + "confidence": 95.0, "from_ocr": true }, { @@ -3041,20 +3025,20 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 398.3333333333333, - "r_x1": 525.6666666666666, - "r_y1": 422.0, - "r_x2": 534.3333333333334, - "r_y2": 422.0, - "r_x3": 534.3333333333334, - "r_y3": 398.3333333333333, + "r_x0": 376.0, + "r_y0": 440.6666666666667, + "r_x1": 376.0, + "r_y1": 487.6666666666667, + "r_x2": 392.0, + "r_y2": 487.6666666666667, + "r_x3": 392.0, + "r_y3": 440.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9642998500000001, + "confidence": 96.0, "from_ocr": true }, { @@ -3066,20 +3050,20 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 426.0, - "r_x1": 525.6666666666666, - "r_y1": 463.0, - "r_x2": 534.0, - "r_y2": 463.0, - "r_x3": 534.0, - "r_y3": 426.0, + "r_x0": 328.0, + "r_y0": 408.3333333333333, + "r_x1": 328.0, + "r_y1": 514.0, + "r_x2": 344.0, + "r_y2": 514.0, + "r_x3": 344.0, + "r_y3": 408.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "content", - "orig": "content", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.96576363, + "confidence": 95.0, "from_ocr": true }, { @@ -3091,135 +3075,195 @@ "a": 255 }, "rect": { - "r_x0": 479.3333333333333, - "r_y0": 160.33333333333334, - "r_x1": 479.3333333333333, - "r_y1": 189.33333333333331, - "r_x2": 488.0, - "r_y2": 189.33333333333331, - "r_x3": 488.0, - "r_y3": 160.33333333333334, + "r_x0": 296.6666666666667, + "r_y0": 440.6666666666667, + "r_x1": 296.6666666666667, + "r_y1": 487.6666666666667, + "r_x2": 312.6666666666667, + "r_y2": 487.6666666666667, + "r_x3": 312.6666666666667, + "r_y3": 440.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96371613, - "from_ocr": true - }, - { - "index": 16, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 193.33333333333331, - "r_x1": 479.3333333333333, - "r_y1": 219.0, - "r_x2": 488.0, - "r_y2": 219.0, - "r_x3": 488.0, - "r_y3": 193.33333333333331, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.9634315499999999, - "from_ocr": true - }, - { - "index": 17, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 222.66666666666669, - "r_x1": 479.3333333333333, - "r_y1": 240.33333333333331, - "r_x2": 485.6666666666667, - "r_y2": 240.33333333333331, - "r_x3": 485.6666666666667, - "r_y3": 222.66666666666669, - "coord_origin": "TOPLEFT" - }, - "text": "row", - "orig": "row", - "text_direction": "left_to_right", - "confidence": 0.9611644699999999, - "from_ocr": true - }, - { - "index": 18, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 283.0, - "r_x1": 479.3333333333333, - "r_y1": 309.0, - "r_x2": 487.6666666666667, - "r_y2": 309.0, - "r_x3": 487.6666666666667, - "r_y3": 283.0, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.95751617, - "from_ocr": true - }, - { - "index": 19, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 312.33333333333337, - "r_x1": 479.3333333333333, - "r_y1": 336.33333333333337, - "r_x2": 488.0, - "r_y2": 336.33333333333337, - "r_x3": 488.0, - "r_y3": 312.33333333333337, - "coord_origin": "TOPLEFT" - }, - "text": "don't", - "orig": "don't", - "text_direction": "left_to_right", - "confidence": 0.9581434600000001, + "confidence": 95.0, "from_ocr": true } ], "children": [ + { + "id": 1, + "label": "text", + "bbox": { + "l": 485.66666666666663, + "t": 97.33333333333333, + "r": 506.3333333333333, + "b": 190.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 89.0, + "cells": [ + { + "index": 0, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 485.66666666666663, + "r_y0": 97.33333333333333, + "r_x1": 485.66666666666663, + "r_y1": 190.0, + "r_x2": 506.3333333333333, + "r_y2": 190.0, + "r_x3": 506.3333333333333, + "r_y3": 97.33333333333333, + "coord_origin": "TOPLEFT" + }, + "text": "Vertically", + "orig": "Vertically", + "text_direction": "left_to_right", + "confidence": 89.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 2, + "label": "text", + "bbox": { + "l": 454.33333333333337, + "t": 112.0, + "r": 475.0, + "b": 182.33333333333334, + "coord_origin": "TOPLEFT" + }, + "confidence": 92.0, + "cells": [ + { + "index": 1, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 454.33333333333337, + "r_y0": 112.0, + "r_x1": 454.33333333333337, + "r_y1": 182.33333333333334, + "r_x2": 475.0, + "r_y2": 182.33333333333334, + "r_x3": 475.0, + "r_y3": 112.0, + "coord_origin": "TOPLEFT" + }, + "text": "merged", + "orig": "merged", + "text_direction": "left_to_right", + "confidence": 92.0, + "from_ocr": true + } + ], + "children": [] + }, { "id": 3, "label": "text", "bbox": { - "l": 572.0, - "t": 275.0, - "r": 580.6666666666666, - "b": 343.66666666666663, + "l": 392.0, + "t": 121.66666666666667, + "r": 408.0, + "b": 168.66666666666666, "coord_origin": "TOPLEFT" }, - "confidence": 0.7740143537521362, + "confidence": 95.0, + "cells": [ + { + "index": 2, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 392.0, + "r_y0": 121.66666666666667, + "r_x1": 392.0, + "r_y1": 168.66666666666666, + "r_x2": 408.0, + "r_y2": 168.66666666666666, + "r_x3": 408.0, + "r_y3": 121.66666666666667, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 4, + "label": "text", + "bbox": { + "l": 312.0, + "t": 121.66666666666667, + "r": 328.0, + "b": 168.66666666666666, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ + { + "index": 3, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 312.0, + "r_y0": 121.66666666666667, + "r_x1": 312.0, + "r_y1": 168.66666666666666, + "r_x2": 328.0, + "r_y2": 168.66666666666666, + "r_x3": 328.0, + "r_y3": 121.66666666666667, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 5, + "label": "text", + "bbox": { + "l": 485.66666666666663, + "t": 232.66666666666666, + "r": 506.3333333333333, + "b": 364.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 92.0, "cells": [ { "index": 4, @@ -3230,22 +3274,37 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 275.0, - "r_x1": 572.0, - "r_y1": 304.0, - "r_x2": 580.6666666666666, - "r_y2": 304.0, - "r_x3": 580.6666666666666, - "r_y3": 275.0, + "r_x0": 485.66666666666663, + "r_y0": 232.66666666666666, + "r_x1": 485.66666666666663, + "r_y1": 364.0, + "r_x2": 506.3333333333333, + "r_y2": 364.0, + "r_x3": 506.3333333333333, + "r_y3": 232.66666666666666, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 0.95741158, + "confidence": 92.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 6, + "label": "text", + "bbox": { + "l": 459.0, + "t": 265.66666666666663, + "r": 475.0, + "b": 336.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ { "index": 5, "rgba": { @@ -3255,36 +3314,36 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 308.0, - "r_x1": 572.0, - "r_y1": 343.66666666666663, - "r_x2": 580.3333333333334, - "r_y2": 343.66666666666663, - "r_x3": 580.3333333333334, - "r_y3": 308.0, + "r_x0": 459.0, + "r_y0": 265.66666666666663, + "r_x1": 459.0, + "r_y1": 336.0, + "r_x2": 475.0, + "r_y2": 336.0, + "r_x3": 475.0, + "r_y3": 265.66666666666663, "coord_origin": "TOPLEFT" }, "text": "column", "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9541709899999999, + "confidence": 94.0, "from_ocr": true } ], "children": [] }, { - "id": 1, + "id": 7, "label": "text", "bbox": { - "l": 572.0, - "t": 381.3333333333333, - "r": 580.6666666666666, - "b": 479.3333333333333, + "l": 408.0, + "t": 247.0, + "r": 424.0, + "b": 349.6666666666667, "coord_origin": "TOPLEFT" }, - "confidence": 0.7769111394882202, + "confidence": 89.0, "cells": [ { "index": 6, @@ -3295,22 +3354,37 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 381.3333333333333, - "r_x1": 572.0, - "r_y1": 410.3333333333333, - "r_x2": 580.6666666666666, - "r_y2": 410.3333333333333, - "r_x3": 580.6666666666666, - "r_y3": 381.3333333333333, + "r_x0": 408.0, + "r_y0": 247.0, + "r_x1": 408.0, + "r_y1": 349.6666666666667, + "r_x2": 424.0, + "r_y2": 349.6666666666667, + "r_x3": 424.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.96515053, + "confidence": 89.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 8, + "label": "text", + "bbox": { + "l": 376.0, + "t": 277.0, + "r": 392.0, + "b": 324.3333333333333, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ { "index": 7, "rgba": { @@ -3320,22 +3394,37 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 414.3333333333333, - "r_x1": 572.0, - "r_y1": 440.3333333333333, - "r_x2": 580.3333333333334, - "r_y2": 440.3333333333333, - "r_x3": 580.3333333333334, - "r_y3": 414.3333333333333, + "r_x0": 376.0, + "r_y0": 277.0, + "r_x1": 376.0, + "r_y1": 324.3333333333333, + "r_x2": 392.0, + "r_y2": 324.3333333333333, + "r_x3": 392.0, + "r_y3": 277.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9623101, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 9, + "label": "text", + "bbox": { + "l": 328.0, + "t": 247.0, + "r": 344.0, + "b": 349.6666666666667, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 8, "rgba": { @@ -3345,36 +3434,36 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 443.3333333333333, - "r_x1": 572.0, - "r_y1": 479.3333333333333, - "r_x2": 580.3333333333334, - "r_y2": 479.3333333333333, - "r_x3": 580.3333333333334, - "r_y3": 443.3333333333333, + "r_x0": 328.0, + "r_y0": 247.0, + "r_x1": 328.0, + "r_y1": 349.6666666666667, + "r_x2": 344.0, + "r_y2": 349.6666666666667, + "r_x3": 344.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.94704376, + "confidence": 95.0, "from_ocr": true } ], "children": [] }, { - "id": 6, + "id": 10, "label": "text", "bbox": { - "l": 525.6666666666666, - "t": 175.0, - "r": 534.3333333333334, - "b": 225.66666666666669, + "l": 296.6666666666667, + "t": 277.33333333333337, + "r": 312.6666666666667, + "b": 324.3333333333333, "coord_origin": "TOPLEFT" }, - "confidence": 0.7583935856819153, + "confidence": 96.0, "cells": [ { "index": 9, @@ -3385,22 +3474,37 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 175.0, - "r_x1": 525.6666666666666, - "r_y1": 204.0, - "r_x2": 534.3333333333334, - "r_y2": 204.0, - "r_x3": 534.3333333333334, - "r_y3": 175.0, + "r_x0": 296.6666666666667, + "r_y0": 277.33333333333337, + "r_x1": 296.6666666666667, + "r_y1": 324.3333333333333, + "r_x2": 312.6666666666667, + "r_y2": 324.3333333333333, + "r_x3": 312.6666666666667, + "r_y3": 277.33333333333337, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96139633, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 11, + "label": "text", + "bbox": { + "l": 490.33333333333337, + "t": 406.3333333333333, + "r": 506.3333333333333, + "b": 518.3333333333333, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 10, "rgba": { @@ -3410,36 +3514,36 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 208.0, - "r_x1": 525.6666666666666, - "r_y1": 225.66666666666669, - "r_x2": 532.0, - "r_y2": 225.66666666666669, - "r_x3": 532.0, - "r_y3": 208.0, + "r_x0": 490.33333333333337, + "r_y0": 406.3333333333333, + "r_x1": 490.33333333333337, + "r_y1": 518.3333333333333, + "r_x2": 506.3333333333333, + "r_y2": 518.3333333333333, + "r_x3": 506.3333333333333, + "r_y3": 406.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.9561322, + "confidence": 95.0, "from_ocr": true } ], "children": [] }, { - "id": 2, + "id": 12, "label": "text", "bbox": { - "l": 525.6666666666666, - "t": 285.66666666666663, - "r": 534.3333333333334, - "b": 333.0, + "l": 459.0, + "t": 429.3333333333333, + "r": 475.0, + "b": 499.3333333333333, "coord_origin": "TOPLEFT" }, - "confidence": 0.7750864028930664, + "confidence": 94.0, "cells": [ { "index": 11, @@ -3450,22 +3554,37 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 285.66666666666663, - "r_x1": 525.6666666666666, - "r_y1": 313.0, - "r_x2": 532.0, - "r_y2": 313.0, - "r_x3": 532.0, - "r_y3": 285.66666666666663, + "r_x0": 459.0, + "r_y0": 429.3333333333333, + "r_x1": 459.0, + "r_y1": 499.3333333333333, + "r_x2": 475.0, + "r_y2": 499.3333333333333, + "r_x3": 475.0, + "r_y3": 429.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "some", - "orig": "some", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9615657, + "confidence": 94.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 13, + "label": "text", + "bbox": { + "l": 408.0, + "t": 408.3333333333333, + "r": 424.0, + "b": 514.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 12, "rgba": { @@ -3475,36 +3594,36 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 317.0, - "r_x1": 525.6666666666666, - "r_y1": 333.0, - "r_x2": 534.3333333333334, - "r_y2": 333.0, - "r_x3": 534.3333333333334, - "r_y3": 317.0, + "r_x0": 408.0, + "r_y0": 408.3333333333333, + "r_x1": 408.0, + "r_y1": 514.0, + "r_x2": 424.0, + "r_y2": 514.0, + "r_x3": 424.0, + "r_y3": 408.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "cell", - "orig": "cell", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.95838455, + "confidence": 95.0, "from_ocr": true } ], "children": [] }, { - "id": 7, + "id": 14, "label": "text", "bbox": { - "l": 525.6666666666666, - "t": 398.3333333333333, - "r": 534.3333333333334, - "b": 463.0, + "l": 376.0, + "t": 440.6666666666667, + "r": 392.0, + "b": 487.6666666666667, "coord_origin": "TOPLEFT" }, - "confidence": 0.7514549493789673, + "confidence": 96.0, "cells": [ { "index": 13, @@ -3515,22 +3634,37 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 398.3333333333333, - "r_x1": 525.6666666666666, - "r_y1": 422.0, - "r_x2": 534.3333333333334, - "r_y2": 422.0, - "r_x3": 534.3333333333334, - "r_y3": 398.3333333333333, + "r_x0": 376.0, + "r_y0": 440.6666666666667, + "r_x1": 376.0, + "r_y1": 487.6666666666667, + "r_x2": 392.0, + "r_y2": 487.6666666666667, + "r_x3": 392.0, + "r_y3": 440.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9642998500000001, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 15, + "label": "text", + "bbox": { + "l": 328.0, + "t": 408.3333333333333, + "r": 344.0, + "b": 514.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 14, "rgba": { @@ -3540,36 +3674,36 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 426.0, - "r_x1": 525.6666666666666, - "r_y1": 463.0, - "r_x2": 534.0, - "r_y2": 463.0, - "r_x3": 534.0, - "r_y3": 426.0, + "r_x0": 328.0, + "r_y0": 408.3333333333333, + "r_x1": 328.0, + "r_y1": 514.0, + "r_x2": 344.0, + "r_y2": 514.0, + "r_x3": 344.0, + "r_y3": 408.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "content", - "orig": "content", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.96576363, + "confidence": 95.0, "from_ocr": true } ], "children": [] }, { - "id": 4, + "id": 16, "label": "text", "bbox": { - "l": 479.3333333333333, - "t": 160.33333333333334, - "r": 488.0, - "b": 240.33333333333331, + "l": 296.6666666666667, + "t": 440.6666666666667, + "r": 312.6666666666667, + "b": 487.6666666666667, "coord_origin": "TOPLEFT" }, - "confidence": 0.769959032535553, + "confidence": 95.0, "cells": [ { "index": 15, @@ -3580,135 +3714,20 @@ "a": 255 }, "rect": { - "r_x0": 479.3333333333333, - "r_y0": 160.33333333333334, - "r_x1": 479.3333333333333, - "r_y1": 189.33333333333331, - "r_x2": 488.0, - "r_y2": 189.33333333333331, - "r_x3": 488.0, - "r_y3": 160.33333333333334, + "r_x0": 296.6666666666667, + "r_y0": 440.6666666666667, + "r_x1": 296.6666666666667, + "r_y1": 487.6666666666667, + "r_x2": 312.6666666666667, + "r_y2": 487.6666666666667, + "r_x3": 312.6666666666667, + "r_y3": 440.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96371613, - "from_ocr": true - }, - { - "index": 16, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 193.33333333333331, - "r_x1": 479.3333333333333, - "r_y1": 219.0, - "r_x2": 488.0, - "r_y2": 219.0, - "r_x3": 488.0, - "r_y3": 193.33333333333331, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.9634315499999999, - "from_ocr": true - }, - { - "index": 17, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 222.66666666666669, - "r_x1": 479.3333333333333, - "r_y1": 240.33333333333331, - "r_x2": 485.6666666666667, - "r_y2": 240.33333333333331, - "r_x3": 485.6666666666667, - "r_y3": 222.66666666666669, - "coord_origin": "TOPLEFT" - }, - "text": "row", - "orig": "row", - "text_direction": "left_to_right", - "confidence": 0.9611644699999999, - "from_ocr": true - } - ], - "children": [] - }, - { - "id": 5, - "label": "text", - "bbox": { - "l": 479.3333333333333, - "t": 283.0, - "r": 488.0, - "b": 336.33333333333337, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.7653545141220093, - "cells": [ - { - "index": 18, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 283.0, - "r_x1": 479.3333333333333, - "r_y1": 309.0, - "r_x2": 487.6666666666667, - "r_y2": 309.0, - "r_x3": 487.6666666666667, - "r_y3": 283.0, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.95751617, - "from_ocr": true - }, - { - "index": 19, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 312.33333333333337, - "r_x1": 479.3333333333333, - "r_y1": 336.33333333333337, - "r_x2": 488.0, - "r_y2": 336.33333333333337, - "r_x3": 488.0, - "r_y3": 312.33333333333337, - "coord_origin": "TOPLEFT" - }, - "text": "don't", - "orig": "don't", - "text_direction": "left_to_right", - "confidence": 0.9581434600000001, + "confidence": 95.0, "from_ocr": true } ], @@ -3718,40 +3737,98 @@ }, "text": null, "otsl_seq": [ - "ecel", + "ched", "ched", "ched", "nl", - "rhed", + "fcel", "fcel", "fcel", "nl", - "rhed", "fcel", - "ecel", + "fcel", + "fcel", "nl" ], - "num_rows": 0, - "num_cols": 0, - "table_cells": [] + "num_rows": 1, + "num_cols": 3, + "table_cells": [ + { + "bbox": { + "l": 443.33333333333337, + "t": 312.0, + "r": 490.33333333333337, + "b": 328.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 262.3333333333333, + "t": 296.6666666666667, + "r": 365.0, + "b": 344.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Some other value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 98.0, + "t": 296.6666666666667, + "r": 203.66666666666669, + "b": 344.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 0, + "end_col_offset_idx": 1, + "text": "Yet another value", + "column_header": false, + "row_header": false, + "row_section": false + } + ] } ], "body": [ { - "label": "section_header", - "id": 8, + "label": "table", + "id": 0, "page_no": 0, "cluster": { - "id": 8, - "label": "section_header", + "id": 0, + "label": "table", "bbox": { - "l": 690.10272, - "t": 201.26337, - "r": 719.1490499999999, - "b": 417.96024, + "l": 277.4178771972656, + "t": 69.0385971069336, + "r": 524.3541717529297, + "b": 551.0978393554688, "coord_origin": "TOPLEFT" }, - "confidence": 0.7426818609237671, + "confidence": 0.9790208339691162, "cells": [ { "index": 0, @@ -3762,43 +3839,22 @@ "a": 255 }, "rect": { - "r_x0": 690.10272, - "r_y0": 417.96024, - "r_x1": 719.1490499999999, - "r_y1": 417.96024, - "r_x2": 719.1490499999999, - "r_y2": 201.26337, - "r_x3": 690.10272, - "r_y3": 201.26337, + "r_x0": 485.66666666666663, + "r_y0": 97.33333333333333, + "r_x1": 485.66666666666663, + "r_y1": 190.0, + "r_x2": 506.3333333333333, + "r_y2": 190.0, + "r_x3": 506.3333333333333, + "r_y3": 97.33333333333333, "coord_origin": "TOPLEFT" }, - "text": "This is a table test ", - "orig": "This is a table test ", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - } - ], - "children": [] - }, - "text": "This is a table test" - }, - { - "label": "picture", - "id": 13, - "page_no": 0, - "cluster": { - "id": 13, - "label": "picture", - "bbox": { - "l": 668.9778442382812, - "t": 70.57099151611328, - "r": 683.4164962768555, - "b": 79.46605682373047, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.5229994654655457, - "cells": [ + "confidence": 89.0, + "from_ocr": true + }, { "index": 1, "rgba": { @@ -3808,88 +3864,22 @@ "a": 255 }, "rect": { - "r_x0": 669.96899, - "r_y0": 78.71936000000005, - "r_x1": 682.25806, - "r_y1": 78.71936000000005, - "r_x2": 682.25806, - "r_y2": 71.99987999999996, - "r_x3": 669.96899, - "r_y3": 71.99987999999996, + "r_x0": 454.33333333333337, + "r_y0": 112.0, + "r_x1": 454.33333333333337, + "r_y1": 182.33333333333334, + "r_x2": 475.0, + "r_y2": 182.33333333333334, + "r_x3": 475.0, + "r_y3": 112.0, "coord_origin": "TOPLEFT" }, - "text": " T", - "orig": " T", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - } - ], - "children": [ - { - "id": 20, - "label": "text", - "bbox": { - "l": 669.96899, - "t": 71.99987999999996, - "r": 682.25806, - "b": 78.71936000000005, - "coord_origin": "TOPLEFT" - }, - "confidence": 1.0, - "cells": [ - { - "index": 1, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 669.96899, - "r_y0": 78.71936000000005, - "r_x1": 682.25806, - "r_y1": 78.71936000000005, - "r_x2": 682.25806, - "r_y2": 71.99987999999996, - "r_x3": 669.96899, - "r_y3": 71.99987999999996, - "coord_origin": "TOPLEFT" - }, - "text": " T", - "orig": " T", - "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - } - ], - "children": [] - } - ] - }, - "text": "", - "annotations": [], - "provenance": null, - "predicted_class": null, - "confidence": null - }, - { - "label": "text", - "id": 0, - "page_no": 0, - "cluster": { - "id": 0, - "label": "text", - "bbox": { - "l": 640.87671, - "t": 78.71447999999998, - "r": 653.16504, - "b": 376.27319, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.8302523493766785, - "cells": [ + "confidence": 92.0, + "from_ocr": true + }, { "index": 2, "rgba": { @@ -3899,43 +3889,47 @@ "a": 255 }, "rect": { - "r_x0": 640.87671, - "r_y0": 376.27319, - "r_x1": 653.16504, - "r_y1": 376.27319, - "r_x2": 653.16504, - "r_y2": 78.71447999999998, - "r_x3": 640.87671, - "r_y3": 78.71447999999998, + "r_x0": 392.0, + "r_y0": 121.66666666666667, + "r_x1": 392.0, + "r_y1": 168.66666666666666, + "r_x2": 408.0, + "r_y2": 168.66666666666666, + "r_x3": 408.0, + "r_y3": 121.66666666666667, "coord_origin": "TOPLEFT" }, - "text": "heteststartswithsomerandomtextandthenatableimage: ", - "orig": "heteststartswithsomerandomtextandthenatableimage: ", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - } - ], - "children": [] - }, - "text": "heteststartswithsomerandomtextandthenatableimage:" - }, - { - "label": "table", - "id": 11, - "page_no": 0, - "cluster": { - "id": 11, - "label": "table", - "bbox": { - "l": 460.5577697753906, - "t": 142.614013671875, - "r": 599.0364074707031, - "b": 499.7825622558594, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.5623787045478821, - "cells": [ + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 3, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 312.0, + "r_y0": 121.66666666666667, + "r_x1": 312.0, + "r_y1": 168.66666666666666, + "r_x2": 328.0, + "r_y2": 168.66666666666666, + "r_x3": 328.0, + "r_y3": 121.66666666666667, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + }, { "index": 4, "rgba": { @@ -3945,20 +3939,20 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 275.0, - "r_x1": 572.0, - "r_y1": 304.0, - "r_x2": 580.6666666666666, - "r_y2": 304.0, - "r_x3": 580.6666666666666, - "r_y3": 275.0, + "r_x0": 485.66666666666663, + "r_y0": 232.66666666666666, + "r_x1": 485.66666666666663, + "r_y1": 364.0, + "r_x2": 506.3333333333333, + "r_y2": 364.0, + "r_x3": 506.3333333333333, + "r_y3": 232.66666666666666, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 0.95741158, + "confidence": 92.0, "from_ocr": true }, { @@ -3970,20 +3964,20 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 308.0, - "r_x1": 572.0, - "r_y1": 343.66666666666663, - "r_x2": 580.3333333333334, - "r_y2": 343.66666666666663, - "r_x3": 580.3333333333334, - "r_y3": 308.0, + "r_x0": 459.0, + "r_y0": 265.66666666666663, + "r_x1": 459.0, + "r_y1": 336.0, + "r_x2": 475.0, + "r_y2": 336.0, + "r_x3": 475.0, + "r_y3": 265.66666666666663, "coord_origin": "TOPLEFT" }, "text": "column", "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9541709899999999, + "confidence": 94.0, "from_ocr": true }, { @@ -3995,20 +3989,20 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 381.3333333333333, - "r_x1": 572.0, - "r_y1": 410.3333333333333, - "r_x2": 580.6666666666666, - "r_y2": 410.3333333333333, - "r_x3": 580.6666666666666, - "r_y3": 381.3333333333333, + "r_x0": 408.0, + "r_y0": 247.0, + "r_x1": 408.0, + "r_y1": 349.6666666666667, + "r_x2": 424.0, + "r_y2": 349.6666666666667, + "r_x3": 424.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.96515053, + "confidence": 89.0, "from_ocr": true }, { @@ -4020,20 +4014,20 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 414.3333333333333, - "r_x1": 572.0, - "r_y1": 440.3333333333333, - "r_x2": 580.3333333333334, - "r_y2": 440.3333333333333, - "r_x3": 580.3333333333334, - "r_y3": 414.3333333333333, + "r_x0": 376.0, + "r_y0": 277.0, + "r_x1": 376.0, + "r_y1": 324.3333333333333, + "r_x2": 392.0, + "r_y2": 324.3333333333333, + "r_x3": 392.0, + "r_y3": 277.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9623101, + "confidence": 96.0, "from_ocr": true }, { @@ -4045,20 +4039,20 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 443.3333333333333, - "r_x1": 572.0, - "r_y1": 479.3333333333333, - "r_x2": 580.3333333333334, - "r_y2": 479.3333333333333, - "r_x3": 580.3333333333334, - "r_y3": 443.3333333333333, + "r_x0": 328.0, + "r_y0": 247.0, + "r_x1": 328.0, + "r_y1": 349.6666666666667, + "r_x2": 344.0, + "r_y2": 349.6666666666667, + "r_x3": 344.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.94704376, + "confidence": 95.0, "from_ocr": true }, { @@ -4070,20 +4064,20 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 175.0, - "r_x1": 525.6666666666666, - "r_y1": 204.0, - "r_x2": 534.3333333333334, - "r_y2": 204.0, - "r_x3": 534.3333333333334, - "r_y3": 175.0, + "r_x0": 296.6666666666667, + "r_y0": 277.33333333333337, + "r_x1": 296.6666666666667, + "r_y1": 324.3333333333333, + "r_x2": 312.6666666666667, + "r_y2": 324.3333333333333, + "r_x3": 312.6666666666667, + "r_y3": 277.33333333333337, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96139633, + "confidence": 96.0, "from_ocr": true }, { @@ -4095,20 +4089,20 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 208.0, - "r_x1": 525.6666666666666, - "r_y1": 225.66666666666669, - "r_x2": 532.0, - "r_y2": 225.66666666666669, - "r_x3": 532.0, - "r_y3": 208.0, + "r_x0": 490.33333333333337, + "r_y0": 406.3333333333333, + "r_x1": 490.33333333333337, + "r_y1": 518.3333333333333, + "r_x2": 506.3333333333333, + "r_y2": 518.3333333333333, + "r_x3": 506.3333333333333, + "r_y3": 406.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.9561322, + "confidence": 95.0, "from_ocr": true }, { @@ -4120,20 +4114,20 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 285.66666666666663, - "r_x1": 525.6666666666666, - "r_y1": 313.0, - "r_x2": 532.0, - "r_y2": 313.0, - "r_x3": 532.0, - "r_y3": 285.66666666666663, + "r_x0": 459.0, + "r_y0": 429.3333333333333, + "r_x1": 459.0, + "r_y1": 499.3333333333333, + "r_x2": 475.0, + "r_y2": 499.3333333333333, + "r_x3": 475.0, + "r_y3": 429.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "some", - "orig": "some", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9615657, + "confidence": 94.0, "from_ocr": true }, { @@ -4145,20 +4139,20 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 317.0, - "r_x1": 525.6666666666666, - "r_y1": 333.0, - "r_x2": 534.3333333333334, - "r_y2": 333.0, - "r_x3": 534.3333333333334, - "r_y3": 317.0, + "r_x0": 408.0, + "r_y0": 408.3333333333333, + "r_x1": 408.0, + "r_y1": 514.0, + "r_x2": 424.0, + "r_y2": 514.0, + "r_x3": 424.0, + "r_y3": 408.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "cell", - "orig": "cell", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.95838455, + "confidence": 95.0, "from_ocr": true }, { @@ -4170,20 +4164,20 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 398.3333333333333, - "r_x1": 525.6666666666666, - "r_y1": 422.0, - "r_x2": 534.3333333333334, - "r_y2": 422.0, - "r_x3": 534.3333333333334, - "r_y3": 398.3333333333333, + "r_x0": 376.0, + "r_y0": 440.6666666666667, + "r_x1": 376.0, + "r_y1": 487.6666666666667, + "r_x2": 392.0, + "r_y2": 487.6666666666667, + "r_x3": 392.0, + "r_y3": 440.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9642998500000001, + "confidence": 96.0, "from_ocr": true }, { @@ -4195,20 +4189,20 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 426.0, - "r_x1": 525.6666666666666, - "r_y1": 463.0, - "r_x2": 534.0, - "r_y2": 463.0, - "r_x3": 534.0, - "r_y3": 426.0, + "r_x0": 328.0, + "r_y0": 408.3333333333333, + "r_x1": 328.0, + "r_y1": 514.0, + "r_x2": 344.0, + "r_y2": 514.0, + "r_x3": 344.0, + "r_y3": 408.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "content", - "orig": "content", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.96576363, + "confidence": 95.0, "from_ocr": true }, { @@ -4220,135 +4214,195 @@ "a": 255 }, "rect": { - "r_x0": 479.3333333333333, - "r_y0": 160.33333333333334, - "r_x1": 479.3333333333333, - "r_y1": 189.33333333333331, - "r_x2": 488.0, - "r_y2": 189.33333333333331, - "r_x3": 488.0, - "r_y3": 160.33333333333334, + "r_x0": 296.6666666666667, + "r_y0": 440.6666666666667, + "r_x1": 296.6666666666667, + "r_y1": 487.6666666666667, + "r_x2": 312.6666666666667, + "r_y2": 487.6666666666667, + "r_x3": 312.6666666666667, + "r_y3": 440.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96371613, - "from_ocr": true - }, - { - "index": 16, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 193.33333333333331, - "r_x1": 479.3333333333333, - "r_y1": 219.0, - "r_x2": 488.0, - "r_y2": 219.0, - "r_x3": 488.0, - "r_y3": 193.33333333333331, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.9634315499999999, - "from_ocr": true - }, - { - "index": 17, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 222.66666666666669, - "r_x1": 479.3333333333333, - "r_y1": 240.33333333333331, - "r_x2": 485.6666666666667, - "r_y2": 240.33333333333331, - "r_x3": 485.6666666666667, - "r_y3": 222.66666666666669, - "coord_origin": "TOPLEFT" - }, - "text": "row", - "orig": "row", - "text_direction": "left_to_right", - "confidence": 0.9611644699999999, - "from_ocr": true - }, - { - "index": 18, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 283.0, - "r_x1": 479.3333333333333, - "r_y1": 309.0, - "r_x2": 487.6666666666667, - "r_y2": 309.0, - "r_x3": 487.6666666666667, - "r_y3": 283.0, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.95751617, - "from_ocr": true - }, - { - "index": 19, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 312.33333333333337, - "r_x1": 479.3333333333333, - "r_y1": 336.33333333333337, - "r_x2": 488.0, - "r_y2": 336.33333333333337, - "r_x3": 488.0, - "r_y3": 312.33333333333337, - "coord_origin": "TOPLEFT" - }, - "text": "don't", - "orig": "don't", - "text_direction": "left_to_right", - "confidence": 0.9581434600000001, + "confidence": 95.0, "from_ocr": true } ], "children": [ + { + "id": 1, + "label": "text", + "bbox": { + "l": 485.66666666666663, + "t": 97.33333333333333, + "r": 506.3333333333333, + "b": 190.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 89.0, + "cells": [ + { + "index": 0, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 485.66666666666663, + "r_y0": 97.33333333333333, + "r_x1": 485.66666666666663, + "r_y1": 190.0, + "r_x2": 506.3333333333333, + "r_y2": 190.0, + "r_x3": 506.3333333333333, + "r_y3": 97.33333333333333, + "coord_origin": "TOPLEFT" + }, + "text": "Vertically", + "orig": "Vertically", + "text_direction": "left_to_right", + "confidence": 89.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 2, + "label": "text", + "bbox": { + "l": 454.33333333333337, + "t": 112.0, + "r": 475.0, + "b": 182.33333333333334, + "coord_origin": "TOPLEFT" + }, + "confidence": 92.0, + "cells": [ + { + "index": 1, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 454.33333333333337, + "r_y0": 112.0, + "r_x1": 454.33333333333337, + "r_y1": 182.33333333333334, + "r_x2": 475.0, + "r_y2": 182.33333333333334, + "r_x3": 475.0, + "r_y3": 112.0, + "coord_origin": "TOPLEFT" + }, + "text": "merged", + "orig": "merged", + "text_direction": "left_to_right", + "confidence": 92.0, + "from_ocr": true + } + ], + "children": [] + }, { "id": 3, "label": "text", "bbox": { - "l": 572.0, - "t": 275.0, - "r": 580.6666666666666, - "b": 343.66666666666663, + "l": 392.0, + "t": 121.66666666666667, + "r": 408.0, + "b": 168.66666666666666, "coord_origin": "TOPLEFT" }, - "confidence": 0.7740143537521362, + "confidence": 95.0, + "cells": [ + { + "index": 2, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 392.0, + "r_y0": 121.66666666666667, + "r_x1": 392.0, + "r_y1": 168.66666666666666, + "r_x2": 408.0, + "r_y2": 168.66666666666666, + "r_x3": 408.0, + "r_y3": 121.66666666666667, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 4, + "label": "text", + "bbox": { + "l": 312.0, + "t": 121.66666666666667, + "r": 328.0, + "b": 168.66666666666666, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ + { + "index": 3, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 312.0, + "r_y0": 121.66666666666667, + "r_x1": 312.0, + "r_y1": 168.66666666666666, + "r_x2": 328.0, + "r_y2": 168.66666666666666, + "r_x3": 328.0, + "r_y3": 121.66666666666667, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 5, + "label": "text", + "bbox": { + "l": 485.66666666666663, + "t": 232.66666666666666, + "r": 506.3333333333333, + "b": 364.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 92.0, "cells": [ { "index": 4, @@ -4359,22 +4413,37 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 275.0, - "r_x1": 572.0, - "r_y1": 304.0, - "r_x2": 580.6666666666666, - "r_y2": 304.0, - "r_x3": 580.6666666666666, - "r_y3": 275.0, + "r_x0": 485.66666666666663, + "r_y0": 232.66666666666666, + "r_x1": 485.66666666666663, + "r_y1": 364.0, + "r_x2": 506.3333333333333, + "r_y2": 364.0, + "r_x3": 506.3333333333333, + "r_y3": 232.66666666666666, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 0.95741158, + "confidence": 92.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 6, + "label": "text", + "bbox": { + "l": 459.0, + "t": 265.66666666666663, + "r": 475.0, + "b": 336.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ { "index": 5, "rgba": { @@ -4384,36 +4453,36 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 308.0, - "r_x1": 572.0, - "r_y1": 343.66666666666663, - "r_x2": 580.3333333333334, - "r_y2": 343.66666666666663, - "r_x3": 580.3333333333334, - "r_y3": 308.0, + "r_x0": 459.0, + "r_y0": 265.66666666666663, + "r_x1": 459.0, + "r_y1": 336.0, + "r_x2": 475.0, + "r_y2": 336.0, + "r_x3": 475.0, + "r_y3": 265.66666666666663, "coord_origin": "TOPLEFT" }, "text": "column", "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9541709899999999, + "confidence": 94.0, "from_ocr": true } ], "children": [] }, { - "id": 1, + "id": 7, "label": "text", "bbox": { - "l": 572.0, - "t": 381.3333333333333, - "r": 580.6666666666666, - "b": 479.3333333333333, + "l": 408.0, + "t": 247.0, + "r": 424.0, + "b": 349.6666666666667, "coord_origin": "TOPLEFT" }, - "confidence": 0.7769111394882202, + "confidence": 89.0, "cells": [ { "index": 6, @@ -4424,22 +4493,37 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 381.3333333333333, - "r_x1": 572.0, - "r_y1": 410.3333333333333, - "r_x2": 580.6666666666666, - "r_y2": 410.3333333333333, - "r_x3": 580.6666666666666, - "r_y3": 381.3333333333333, + "r_x0": 408.0, + "r_y0": 247.0, + "r_x1": 408.0, + "r_y1": 349.6666666666667, + "r_x2": 424.0, + "r_y2": 349.6666666666667, + "r_x3": 424.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.96515053, + "confidence": 89.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 8, + "label": "text", + "bbox": { + "l": 376.0, + "t": 277.0, + "r": 392.0, + "b": 324.3333333333333, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ { "index": 7, "rgba": { @@ -4449,22 +4533,37 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 414.3333333333333, - "r_x1": 572.0, - "r_y1": 440.3333333333333, - "r_x2": 580.3333333333334, - "r_y2": 440.3333333333333, - "r_x3": 580.3333333333334, - "r_y3": 414.3333333333333, + "r_x0": 376.0, + "r_y0": 277.0, + "r_x1": 376.0, + "r_y1": 324.3333333333333, + "r_x2": 392.0, + "r_y2": 324.3333333333333, + "r_x3": 392.0, + "r_y3": 277.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9623101, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 9, + "label": "text", + "bbox": { + "l": 328.0, + "t": 247.0, + "r": 344.0, + "b": 349.6666666666667, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 8, "rgba": { @@ -4474,36 +4573,36 @@ "a": 255 }, "rect": { - "r_x0": 572.0, - "r_y0": 443.3333333333333, - "r_x1": 572.0, - "r_y1": 479.3333333333333, - "r_x2": 580.3333333333334, - "r_y2": 479.3333333333333, - "r_x3": 580.3333333333334, - "r_y3": 443.3333333333333, + "r_x0": 328.0, + "r_y0": 247.0, + "r_x1": 328.0, + "r_y1": 349.6666666666667, + "r_x2": 344.0, + "r_y2": 349.6666666666667, + "r_x3": 344.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.94704376, + "confidence": 95.0, "from_ocr": true } ], "children": [] }, { - "id": 6, + "id": 10, "label": "text", "bbox": { - "l": 525.6666666666666, - "t": 175.0, - "r": 534.3333333333334, - "b": 225.66666666666669, + "l": 296.6666666666667, + "t": 277.33333333333337, + "r": 312.6666666666667, + "b": 324.3333333333333, "coord_origin": "TOPLEFT" }, - "confidence": 0.7583935856819153, + "confidence": 96.0, "cells": [ { "index": 9, @@ -4514,22 +4613,37 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 175.0, - "r_x1": 525.6666666666666, - "r_y1": 204.0, - "r_x2": 534.3333333333334, - "r_y2": 204.0, - "r_x3": 534.3333333333334, - "r_y3": 175.0, + "r_x0": 296.6666666666667, + "r_y0": 277.33333333333337, + "r_x1": 296.6666666666667, + "r_y1": 324.3333333333333, + "r_x2": 312.6666666666667, + "r_y2": 324.3333333333333, + "r_x3": 312.6666666666667, + "r_y3": 277.33333333333337, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96139633, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 11, + "label": "text", + "bbox": { + "l": 490.33333333333337, + "t": 406.3333333333333, + "r": 506.3333333333333, + "b": 518.3333333333333, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 10, "rgba": { @@ -4539,36 +4653,36 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 208.0, - "r_x1": 525.6666666666666, - "r_y1": 225.66666666666669, - "r_x2": 532.0, - "r_y2": 225.66666666666669, - "r_x3": 532.0, - "r_y3": 208.0, + "r_x0": 490.33333333333337, + "r_y0": 406.3333333333333, + "r_x1": 490.33333333333337, + "r_y1": 518.3333333333333, + "r_x2": 506.3333333333333, + "r_y2": 518.3333333333333, + "r_x3": 506.3333333333333, + "r_y3": 406.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.9561322, + "confidence": 95.0, "from_ocr": true } ], "children": [] }, { - "id": 2, + "id": 12, "label": "text", "bbox": { - "l": 525.6666666666666, - "t": 285.66666666666663, - "r": 534.3333333333334, - "b": 333.0, + "l": 459.0, + "t": 429.3333333333333, + "r": 475.0, + "b": 499.3333333333333, "coord_origin": "TOPLEFT" }, - "confidence": 0.7750864028930664, + "confidence": 94.0, "cells": [ { "index": 11, @@ -4579,22 +4693,37 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 285.66666666666663, - "r_x1": 525.6666666666666, - "r_y1": 313.0, - "r_x2": 532.0, - "r_y2": 313.0, - "r_x3": 532.0, - "r_y3": 285.66666666666663, + "r_x0": 459.0, + "r_y0": 429.3333333333333, + "r_x1": 459.0, + "r_y1": 499.3333333333333, + "r_x2": 475.0, + "r_y2": 499.3333333333333, + "r_x3": 475.0, + "r_y3": 429.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "some", - "orig": "some", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9615657, + "confidence": 94.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 13, + "label": "text", + "bbox": { + "l": 408.0, + "t": 408.3333333333333, + "r": 424.0, + "b": 514.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 12, "rgba": { @@ -4604,36 +4733,36 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 317.0, - "r_x1": 525.6666666666666, - "r_y1": 333.0, - "r_x2": 534.3333333333334, - "r_y2": 333.0, - "r_x3": 534.3333333333334, - "r_y3": 317.0, + "r_x0": 408.0, + "r_y0": 408.3333333333333, + "r_x1": 408.0, + "r_y1": 514.0, + "r_x2": 424.0, + "r_y2": 514.0, + "r_x3": 424.0, + "r_y3": 408.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "cell", - "orig": "cell", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.95838455, + "confidence": 95.0, "from_ocr": true } ], "children": [] }, { - "id": 7, + "id": 14, "label": "text", "bbox": { - "l": 525.6666666666666, - "t": 398.3333333333333, - "r": 534.3333333333334, - "b": 463.0, + "l": 376.0, + "t": 440.6666666666667, + "r": 392.0, + "b": 487.6666666666667, "coord_origin": "TOPLEFT" }, - "confidence": 0.7514549493789673, + "confidence": 96.0, "cells": [ { "index": 13, @@ -4644,22 +4773,37 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 398.3333333333333, - "r_x1": 525.6666666666666, - "r_y1": 422.0, - "r_x2": 534.3333333333334, - "r_y2": 422.0, - "r_x3": 534.3333333333334, - "r_y3": 398.3333333333333, + "r_x0": 376.0, + "r_y0": 440.6666666666667, + "r_x1": 376.0, + "r_y1": 487.6666666666667, + "r_x2": 392.0, + "r_y2": 487.6666666666667, + "r_x3": 392.0, + "r_y3": 440.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9642998500000001, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 15, + "label": "text", + "bbox": { + "l": 328.0, + "t": 408.3333333333333, + "r": 344.0, + "b": 514.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 14, "rgba": { @@ -4669,36 +4813,36 @@ "a": 255 }, "rect": { - "r_x0": 525.6666666666666, - "r_y0": 426.0, - "r_x1": 525.6666666666666, - "r_y1": 463.0, - "r_x2": 534.0, - "r_y2": 463.0, - "r_x3": 534.0, - "r_y3": 426.0, + "r_x0": 328.0, + "r_y0": 408.3333333333333, + "r_x1": 328.0, + "r_y1": 514.0, + "r_x2": 344.0, + "r_y2": 514.0, + "r_x3": 344.0, + "r_y3": 408.3333333333333, "coord_origin": "TOPLEFT" }, - "text": "content", - "orig": "content", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.96576363, + "confidence": 95.0, "from_ocr": true } ], "children": [] }, { - "id": 4, + "id": 16, "label": "text", "bbox": { - "l": 479.3333333333333, - "t": 160.33333333333334, - "r": 488.0, - "b": 240.33333333333331, + "l": 296.6666666666667, + "t": 440.6666666666667, + "r": 312.6666666666667, + "b": 487.6666666666667, "coord_origin": "TOPLEFT" }, - "confidence": 0.769959032535553, + "confidence": 95.0, "cells": [ { "index": 15, @@ -4709,135 +4853,20 @@ "a": 255 }, "rect": { - "r_x0": 479.3333333333333, - "r_y0": 160.33333333333334, - "r_x1": 479.3333333333333, - "r_y1": 189.33333333333331, - "r_x2": 488.0, - "r_y2": 189.33333333333331, - "r_x3": 488.0, - "r_y3": 160.33333333333334, + "r_x0": 296.6666666666667, + "r_y0": 440.6666666666667, + "r_x1": 296.6666666666667, + "r_y1": 487.6666666666667, + "r_x2": 312.6666666666667, + "r_y2": 487.6666666666667, + "r_x3": 312.6666666666667, + "r_y3": 440.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96371613, - "from_ocr": true - }, - { - "index": 16, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 193.33333333333331, - "r_x1": 479.3333333333333, - "r_y1": 219.0, - "r_x2": 488.0, - "r_y2": 219.0, - "r_x3": 488.0, - "r_y3": 193.33333333333331, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.9634315499999999, - "from_ocr": true - }, - { - "index": 17, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 222.66666666666669, - "r_x1": 479.3333333333333, - "r_y1": 240.33333333333331, - "r_x2": 485.6666666666667, - "r_y2": 240.33333333333331, - "r_x3": 485.6666666666667, - "r_y3": 222.66666666666669, - "coord_origin": "TOPLEFT" - }, - "text": "row", - "orig": "row", - "text_direction": "left_to_right", - "confidence": 0.9611644699999999, - "from_ocr": true - } - ], - "children": [] - }, - { - "id": 5, - "label": "text", - "bbox": { - "l": 479.3333333333333, - "t": 283.0, - "r": 488.0, - "b": 336.33333333333337, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.7653545141220093, - "cells": [ - { - "index": 18, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 283.0, - "r_x1": 479.3333333333333, - "r_y1": 309.0, - "r_x2": 487.6666666666667, - "r_y2": 309.0, - "r_x3": 487.6666666666667, - "r_y3": 283.0, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.95751617, - "from_ocr": true - }, - { - "index": 19, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 479.3333333333333, - "r_y0": 312.33333333333337, - "r_x1": 479.3333333333333, - "r_y1": 336.33333333333337, - "r_x2": 488.0, - "r_y2": 336.33333333333337, - "r_x3": 488.0, - "r_y3": 312.33333333333337, - "coord_origin": "TOPLEFT" - }, - "text": "don't", - "orig": "don't", - "text_direction": "left_to_right", - "confidence": 0.9581434600000001, + "confidence": 95.0, "from_ocr": true } ], @@ -4847,22 +4876,80 @@ }, "text": null, "otsl_seq": [ - "ecel", + "ched", "ched", "ched", "nl", - "rhed", + "fcel", "fcel", "fcel", "nl", - "rhed", "fcel", - "ecel", + "fcel", + "fcel", "nl" ], - "num_rows": 0, - "num_cols": 0, - "table_cells": [] + "num_rows": 1, + "num_cols": 3, + "table_cells": [ + { + "bbox": { + "l": 443.33333333333337, + "t": 312.0, + "r": 490.33333333333337, + "b": 328.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 262.3333333333333, + "t": 296.6666666666667, + "r": 365.0, + "b": 344.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Some other value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 98.0, + "t": 296.6666666666667, + "r": 203.66666666666669, + "b": 344.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 0, + "end_col_offset_idx": 1, + "text": "Yet another value", + "column_header": false, + "row_header": false, + "row_section": false + } + ] } ], "headers": [] diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_90.doctags.txt b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_90.doctags.txt index 5a2c9878..a9e1d3bd 100644 --- a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_90.doctags.txt +++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_90.doctags.txt @@ -1,9 +1,5 @@ - -Column 2andhaveinside -Column 1have contentother -Column 0some cellsnothing -this is row 0and row 1and last row 2 +
\ No newline at end of file diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_90.json b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_90.json index 648e8fe1..ad27e476 100644 --- a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_90.json +++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_90.json @@ -27,13 +27,13 @@ "file-info": { "filename": "ocr_test_rotated_90.pdf", "filename-prov": null, - "document-hash": "2fb20caf4f54c878a0b454b496010d92adc6ae1b7f10fbd9ba1ba26260f818a8", + "document-hash": "418ae4425f514f002bd4223ea3003c17f319cbeafd67801732d58f2bedb3bd91", "#-pages": 1, "collection-name": null, "description": null, "page-hashes": [ { - "hash": "56c847ad7c5ab9f0346a325510af001ab66a9bb45f65ffc7bbfc60c929def7d2", + "hash": "36315c08dc861ecde4be6179d2f155da0519b93e0311c290f8db164f593d36d8", "model": "default", "page": 1 } @@ -52,10 +52,10 @@ "prov": [ { "bbox": [ - 75.13359832763672, - 102.99908447265625, - 361.18695068359375, - 562.1403198242188 + 87.64582824707031, + 69.0385971069336, + 334.5821228027344, + 551.0978393554688 ], "page": 1, "span": [ @@ -68,415 +68,9 @@ "text": "", "type": "table", "payload": null, - "#-cols": 4, - "#-rows": 4, - "data": [ - [ - { - "bbox": [ - 105.0718660651769, - 304.7354643560275, - 119.73306194406335, - 369.59883715876185 - ], - "spans": [ - [ - 0, - 0 - ] - ], - "text": "Column 2", - "type": "body", - "col": 0, - "col-header": false, - "col-span": [ - 0, - 1 - ], - "row": 0, - "row-header": false, - "row-span": [ - 0, - 1 - ] - }, - { - "bbox": [ - 172.26899264661517, - 324.3168597625203, - 188.15195177751215, - 352.46511670018316 - ], - "spans": [ - [ - 0, - 1 - ] - ], - "text": "and", - "type": "body", - "col": 1, - "col-header": false, - "col-span": [ - 1, - 2 - ], - "row": 0, - "row-header": false, - "row-span": [ - 0, - 1 - ] - }, - { - "bbox": [ - 240.68788382926402, - 321.869185135892, - 256.570842960161, - 356.13662847492196 - ], - "spans": [ - [ - 0, - 2 - ] - ], - "text": "have", - "type": "body", - "col": 2, - "col-header": false, - "col-span": [ - 2, - 3 - ], - "row": 0, - "row-header": false, - "row-span": [ - 0, - 1 - ] - }, - { - "bbox": [ - 312.772072637728, - 319.42151173034614, - 326.21150018118874, - 359.8081389276117 - ], - "spans": [ - [ - 0, - 3 - ] - ], - "text": "inside", - "type": "body", - "col": 3, - "col-header": false, - "col-span": [ - 3, - 4 - ], - "row": 0, - "row-header": false, - "row-span": [ - 0, - 1 - ] - } - ], - [ - { - "bbox": [ - 105.0718660651769, - 419.77616156495424, - 119.73306194406335, - 483.4156981046677 - ], - "spans": [ - [ - 1, - 0 - ] - ], - "text": "Column 1", - "type": "body", - "col": 0, - "col-header": false, - "col-span": [ - 0, - 1 - ], - "row": 1, - "row-header": false, - "row-span": [ - 1, - 2 - ] - }, - { - "bbox": [ - 172.26898999097682, - 408.7616301134671, - 185.70842261785268, - 495.6540658231026 - ], - "spans": [ - [ - 1, - 1 - ] - ], - "text": "have content", - "type": "body", - "col": 1, - "col-header": false, - "col-span": [ - 1, - 2 - ], - "row": 1, - "row-header": false, - "row-span": [ - 1, - 2 - ] - }, - { - "bbox": [ - 240.68788377535307, - 433.23837164942523, - 255.34907711253194, - 468.729651251476 - ], - "spans": [ - [ - 1, - 2 - ] - ], - "text": "other", - "type": "body", - "col": 2, - "col-header": false, - "col-span": [ - 2, - 3 - ], - "row": 1, - "row-header": false, - "row-span": [ - 1, - 2 - ] - }, - { - "bbox": null, - "spans": [ - [ - 1, - 3 - ] - ], - "text": "", - "type": "body" - } - ], - [ - { - "bbox": [ - 105.07186605295925, - 532.3691850430223, - 119.73306193184567, - 597.2325578457567 - ], - "spans": [ - [ - 2, - 0 - ] - ], - "text": "Column 0", - "type": "body", - "col": 0, - "col-header": false, - "col-span": [ - 0, - 1 - ], - "row": 2, - "row-header": false, - "row-span": [ - 2, - 3 - ] - }, - { - "bbox": [ - 172.26899069197702, - 529.9215107729757, - 186.93018720629036, - 600.9040699770771 - ], - "spans": [ - [ - 2, - 1 - ] - ], - "text": "some cells", - "type": "body", - "col": 1, - "col-header": false, - "col-span": [ - 1, - 2 - ], - "row": 2, - "row-header": false, - "row-span": [ - 2, - 3 - ] - }, - { - "bbox": null, - "spans": [ - [ - 2, - 2 - ] - ], - "text": "", - "type": "body" - }, - { - "bbox": [ - 311.49999737299976, - 536.775000315586, - 332.5000022770002, - 592.9083316144141 - ], - "spans": [ - [ - 2, - 3 - ] - ], - "text": "nothing", - "type": "body", - "col": 3, - "col-header": false, - "col-span": [ - 3, - 4 - ], - "row": 2, - "row-header": false, - "row-span": [ - 2, - 3 - ] - } - ], - [ - { - "bbox": null, - "spans": [ - [ - 3, - 0 - ] - ], - "text": "", - "type": "body" - }, - { - "bbox": [ - 172.2689900422697, - 638.8430233885732, - 186.93018846286373, - 719.6162777831045 - ], - "spans": [ - [ - 3, - 1 - ] - ], - "text": "this is row 0", - "type": "body", - "col": 1, - "col-header": false, - "col-span": [ - 1, - 2 - ], - "row": 3, - "row-header": false, - "row-span": [ - 3, - 4 - ] - }, - { - "bbox": [ - 240.68788248006402, - 647.4098827174411, - 255.34907835895044, - 712.2732555201754 - ], - "spans": [ - [ - 3, - 2 - ] - ], - "text": "and row 1", - "type": "body", - "col": 2, - "col-header": false, - "col-span": [ - 2, - 3 - ], - "row": 3, - "row-header": false, - "row-span": [ - 3, - 4 - ] - }, - { - "bbox": [ - 313.9938353514431, - 633.9476737903873, - 327.43326861374595, - 725.735464724632 - ], - "spans": [ - [ - 3, - 3 - ] - ], - "text": "and last row 2", - "type": "body", - "col": 3, - "col-header": false, - "col-span": [ - 3, - 4 - ], - "row": 3, - "row-header": false, - "row-span": [ - 3, - 4 - ] - } - ] - ], + "#-cols": 0, + "#-rows": 0, + "data": [], "model": null, "bounding-box": null } @@ -486,9 +80,9 @@ "footnotes": [], "page-dimensions": [ { - "height": 842.0, + "height": 792.0, "page": 1, - "width": 595.0 + "width": 612.0 } ], "page-footers": [], diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_90.md b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_90.md index a45b3c36..e69de29b 100644 --- a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_90.md +++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_90.md @@ -1,5 +0,0 @@ -| Column 2 | and | have | inside | -|------------|---------------|-----------|----------------| -| Column 1 | have content | other | | -| Column 0 | some cells | | nothing | -| | this is row 0 | and row 1 | and last row 2 | \ No newline at end of file diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_90.pages.json b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_90.pages.json index b9d55049..c26e2ec8 100644 --- a/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_90.pages.json +++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test_rotated_90.pages.json @@ -2,8 +2,8 @@ { "page_no": 0, "size": { - "width": 792.0, - "height": 612.0 + "width": 612.0, + "height": 792.0 }, "parsed_page": { "dimension": { @@ -11,47 +11,47 @@ "rect": { "r_x0": 0.0, "r_y0": 0.0, - "r_x1": 612.0, + "r_x1": 792.0, "r_y1": 0.0, - "r_x2": 612.0, - "r_y2": 792.0, + "r_x2": 792.0, + "r_y2": 612.0, "r_x3": 0.0, - "r_y3": 792.0, + "r_y3": 612.0, "coord_origin": "BOTTOMLEFT" }, "boundary_type": "crop_box", "art_bbox": { "l": 0.0, - "t": 792.0, - "r": 612.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" }, "bleed_bbox": { "l": 0.0, - "t": 792.0, - "r": 612.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" }, "crop_bbox": { "l": 0.0, - "t": 792.0, - "r": 612.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" }, "media_bbox": { "l": 0.0, - "t": 792.0, - "r": 612.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" }, "trim_bbox": { "l": 0.0, - "t": 792.0, - "r": 612.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" } @@ -69,21 +69,21 @@ "a": 255 }, "rect": { - "r_x0": 72.850723, - "r_y0": 410.7366, - "r_x1": 101.89737999999998, - "r_y1": 410.7366, - "r_x2": 101.89737999999998, - "r_y2": 194.03978999999998, - "r_x3": 72.850723, - "r_y3": 194.03978999999998, + "r_x0": 126.33333333333334, + "r_y0": 694.6666666666666, + "r_x1": 126.33333333333334, + "r_y1": 602.0, + "r_x2": 105.66666666666666, + "r_y2": 602.0, + "r_x3": 105.66666666666666, + "r_y3": 694.6666666666666, "coord_origin": "TOPLEFT" }, - "text": "This is a table test ", - "orig": "This is a table test ", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true }, { "index": 1, @@ -94,21 +94,21 @@ "a": 255 }, "rect": { - "r_x0": 124.28839, - "r_y0": 540.000015, - "r_x1": 136.57715, - "r_y1": 540.000015, - "r_x2": 136.57715, - "r_y2": 235.72681, - "r_x3": 124.28839, - "r_y3": 235.72681, + "r_x0": 157.66666666666669, + "r_y0": 680.3333333333334, + "r_x1": 157.66666666666669, + "r_y1": 610.0, + "r_x2": 137.0, + "r_y2": 610.0, + "r_x3": 137.0, + "r_y3": 680.3333333333334, "coord_origin": "TOPLEFT" }, - "text": "Theteststartswithsomerandomtextandthenatableimage: ", - "orig": "Theteststartswithsomerandomtextandthenatableimage: ", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 2, @@ -119,20 +119,20 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 337.0, - "r_x1": 191.0, - "r_y1": 308.0, - "r_x2": 182.33333333333334, - "r_y2": 308.0, - "r_x3": 182.33333333333334, - "r_y3": 337.0, + "r_x0": 220.0, + "r_y0": 670.3333333333334, + "r_x1": 220.0, + "r_y1": 623.3333333333334, + "r_x2": 204.0, + "r_y2": 623.3333333333334, + "r_x3": 204.0, + "r_y3": 670.3333333333334, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9576889799999999, + "confidence": 96.0, "from_ocr": true }, { @@ -144,20 +144,20 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 304.0, - "r_x1": 191.0, - "r_y1": 268.33333333333337, - "r_x2": 182.33333333333334, - "r_y2": 268.33333333333337, - "r_x3": 182.33333333333334, - "r_y3": 304.0, + "r_x0": 300.0, + "r_y0": 670.3333333333334, + "r_x1": 300.0, + "r_y1": 623.3333333333334, + "r_x2": 284.0, + "r_y2": 623.3333333333334, + "r_x3": 284.0, + "r_y3": 670.3333333333334, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9576889799999999, + "confidence": 96.0, "from_ocr": true }, { @@ -169,20 +169,20 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 230.66666666666666, - "r_x1": 191.0, - "r_y1": 201.66666666666669, - "r_x2": 182.33333333333334, - "r_y2": 201.66666666666669, - "r_x3": 182.33333333333334, - "r_y3": 230.66666666666666, + "r_x0": 126.33333333333334, + "r_y0": 559.6666666666667, + "r_x1": 126.33333333333334, + "r_y1": 428.0, + "r_x2": 105.66666666666666, + "r_y2": 428.0, + "r_x3": 105.66666666666666, + "r_y3": 559.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 0.9617948900000001, + "confidence": 91.0, "from_ocr": true }, { @@ -194,20 +194,20 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 197.66666666666669, - "r_x1": 191.0, - "r_y1": 172.0, - "r_x2": 182.33333333333334, - "r_y2": 172.0, - "r_x3": 182.33333333333334, - "r_y3": 197.66666666666669, + "r_x0": 153.0, + "r_y0": 526.6666666666667, + "r_x1": 153.0, + "r_y1": 456.0, + "r_x2": 137.0, + "r_y2": 456.0, + "r_x3": 137.0, + "r_y3": 526.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.96105423, + "confidence": 95.0, "from_ocr": true }, { @@ -219,20 +219,20 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 168.66666666666669, - "r_x1": 191.0, - "r_y1": 133.0, - "r_x2": 182.33333333333334, - "r_y2": 133.0, - "r_x3": 182.33333333333334, - "r_y3": 168.66666666666669, + "r_x0": 204.33333333333334, + "r_y0": 545.0, + "r_x1": 204.33333333333334, + "r_y1": 442.3333333333333, + "r_x2": 188.33333333333331, + "r_y2": 442.3333333333333, + "r_x3": 188.33333333333331, + "r_y3": 545.0, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.95868614, + "confidence": 95.0, "from_ocr": true }, { @@ -244,20 +244,20 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 437.3333333333333, - "r_x1": 237.33333333333331, - "r_y1": 408.3333333333333, - "r_x2": 228.66666666666669, - "r_y2": 408.3333333333333, - "r_x3": 228.66666666666669, - "r_y3": 437.3333333333333, + "r_x0": 236.0, + "r_y0": 515.0, + "r_x1": 236.0, + "r_y1": 468.0, + "r_x2": 220.0, + "r_y2": 468.0, + "r_x3": 220.0, + "r_y3": 515.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9579908, + "confidence": 96.0, "from_ocr": true }, { @@ -269,20 +269,20 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 404.0, - "r_x1": 237.33333333333331, - "r_y1": 386.3333333333333, - "r_x2": 231.0, - "r_y2": 386.3333333333333, - "r_x3": 231.0, - "r_y3": 404.0, + "r_x0": 284.0, + "r_y0": 545.0, + "r_x1": 284.0, + "r_y1": 442.3333333333333, + "r_x2": 268.0, + "r_y2": 442.3333333333333, + "r_x3": 268.0, + "r_y3": 545.0, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.96640068, + "confidence": 93.0, "from_ocr": true }, { @@ -294,20 +294,20 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 326.33333333333337, - "r_x1": 237.33333333333331, - "r_y1": 299.0, - "r_x2": 231.0, - "r_y2": 299.0, - "r_x3": 231.0, - "r_y3": 326.33333333333337, + "r_x0": 315.33333333333337, + "r_y0": 515.0, + "r_x1": 315.33333333333337, + "r_y1": 468.0, + "r_x2": 299.66666666666663, + "r_y2": 468.0, + "r_x3": 299.66666666666663, + "r_y3": 515.0, "coord_origin": "TOPLEFT" }, - "text": "some", - "orig": "some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96376541, + "confidence": 96.0, "from_ocr": true }, { @@ -319,20 +319,20 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 295.33333333333337, - "r_x1": 237.33333333333331, - "r_y1": 279.0, - "r_x2": 228.66666666666669, - "r_y2": 279.0, - "r_x3": 228.66666666666669, - "r_y3": 295.33333333333337, + "r_x0": 121.66666666666666, + "r_y0": 385.6666666666667, + "r_x1": 121.66666666666666, + "r_y1": 274.0, + "r_x2": 105.66666666666666, + "r_y2": 274.0, + "r_x3": 105.66666666666666, + "r_y3": 385.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "cell", - "orig": "cell", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.95824509, + "confidence": 95.0, "from_ocr": true }, { @@ -344,20 +344,20 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 213.66666666666666, - "r_x1": 237.33333333333331, - "r_y1": 190.0, - "r_x2": 228.66666666666669, - "r_y2": 190.0, - "r_x3": 228.66666666666669, - "r_y3": 213.66666666666666, + "r_x0": 153.0, + "r_y0": 363.0, + "r_x1": 153.0, + "r_y1": 292.66666666666663, + "r_x2": 137.0, + "r_y2": 292.66666666666663, + "r_x3": 137.0, + "r_y3": 363.0, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9643471499999999, + "confidence": 94.0, "from_ocr": true }, { @@ -369,20 +369,20 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 186.0, - "r_x1": 237.33333333333331, - "r_y1": 149.0, - "r_x2": 229.0, - "r_y2": 149.0, - "r_x3": 229.0, - "r_y3": 186.0, + "r_x0": 204.33333333333334, + "r_y0": 384.0, + "r_x1": 204.33333333333334, + "r_y1": 278.0, + "r_x2": 188.33333333333331, + "r_y2": 278.0, + "r_x3": 188.33333333333331, + "r_y3": 384.0, "coord_origin": "TOPLEFT" }, - "text": "content", - "orig": "content", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.96289528, + "confidence": 95.0, "from_ocr": true }, { @@ -394,20 +394,20 @@ "a": 255 }, "rect": { - "r_x0": 283.66666666666663, - "r_y0": 451.6666666666667, - "r_x1": 283.66666666666663, - "r_y1": 422.6666666666667, - "r_x2": 275.0, - "r_y2": 422.6666666666667, - "r_x3": 275.0, - "r_y3": 451.6666666666667, + "r_x0": 236.0, + "r_y0": 351.33333333333337, + "r_x1": 236.0, + "r_y1": 304.33333333333337, + "r_x2": 220.0, + "r_y2": 304.33333333333337, + "r_x3": 220.0, + "r_y3": 351.33333333333337, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9611363199999999, + "confidence": 95.0, "from_ocr": true }, { @@ -419,20 +419,20 @@ "a": 255 }, "rect": { - "r_x0": 283.66666666666663, - "r_y0": 419.0, - "r_x1": 283.66666666666663, - "r_y1": 393.0, - "r_x2": 275.0, - "r_y2": 393.0, - "r_x3": 275.0, - "r_y3": 419.0, + "r_x0": 284.0, + "r_y0": 383.6666666666667, + "r_x1": 284.0, + "r_y1": 278.0, + "r_x2": 268.0, + "r_y2": 278.0, + "r_x3": 268.0, + "r_y3": 383.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.9588653600000001, + "confidence": 95.0, "from_ocr": true }, { @@ -444,70 +444,20 @@ "a": 255 }, "rect": { - "r_x0": 283.66666666666663, - "r_y0": 389.3333333333333, - "r_x1": 283.66666666666663, - "r_y1": 371.6666666666667, - "r_x2": 277.33333333333337, - "r_y2": 371.6666666666667, - "r_x3": 277.33333333333337, - "r_y3": 389.3333333333333, + "r_x0": 315.33333333333337, + "r_y0": 351.33333333333337, + "r_x1": 315.33333333333337, + "r_y1": 304.33333333333337, + "r_x2": 299.66666666666663, + "r_y2": 304.33333333333337, + "r_x3": 299.66666666666663, + "r_y3": 351.33333333333337, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.95681549, - "from_ocr": true - }, - { - "index": 16, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 283.66666666666663, - "r_y0": 329.0, - "r_x1": 283.66666666666663, - "r_y1": 303.0, - "r_x2": 275.0, - "r_y2": 303.0, - "r_x3": 275.0, - "r_y3": 329.0, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.9589106, - "from_ocr": true - }, - { - "index": 17, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 283.66666666666663, - "r_y0": 299.66666666666663, - "r_x1": 283.66666666666663, - "r_y1": 275.66666666666663, - "r_x2": 275.0, - "r_y2": 275.66666666666663, - "r_x3": 275.0, - "r_y3": 299.66666666666663, - "coord_origin": "TOPLEFT" - }, - "text": "don't", - "orig": "don't", - "text_direction": "left_to_right", - "confidence": 0.96121948, + "confidence": 95.0, "from_ocr": true } ], @@ -521,16 +471,16 @@ "layout": { "clusters": [ { - "id": 9, - "label": "section_header", + "id": 0, + "label": "table", "bbox": { - "l": 72.850723, - "t": 194.03978999999998, - "r": 101.89737999999998, - "b": 410.7366, + "l": 87.64582824707031, + "t": 240.90216064453125, + "r": 334.5821228027344, + "b": 722.9614028930664, "coord_origin": "TOPLEFT" }, - "confidence": 0.6652874946594238, + "confidence": 0.9790208339691162, "cells": [ { "index": 0, @@ -541,37 +491,22 @@ "a": 255 }, "rect": { - "r_x0": 72.850723, - "r_y0": 410.7366, - "r_x1": 101.89737999999998, - "r_y1": 410.7366, - "r_x2": 101.89737999999998, - "r_y2": 194.03978999999998, - "r_x3": 72.850723, - "r_y3": 194.03978999999998, + "r_x0": 126.33333333333334, + "r_y0": 694.6666666666666, + "r_x1": 126.33333333333334, + "r_y1": 602.0, + "r_x2": 105.66666666666666, + "r_y2": 602.0, + "r_x3": 105.66666666666666, + "r_y3": 694.6666666666666, "coord_origin": "TOPLEFT" }, - "text": "This is a table test ", - "orig": "This is a table test ", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - } - ], - "children": [] - }, - { - "id": 7, - "label": "text", - "bbox": { - "l": 124.28839, - "t": 235.72681, - "r": 136.57715, - "b": 540.000015, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.8457421064376831, - "cells": [ + "confidence": 90.0, + "from_ocr": true + }, { "index": 1, "rgba": { @@ -581,37 +516,22 @@ "a": 255 }, "rect": { - "r_x0": 124.28839, - "r_y0": 540.000015, - "r_x1": 136.57715, - "r_y1": 540.000015, - "r_x2": 136.57715, - "r_y2": 235.72681, - "r_x3": 124.28839, - "r_y3": 235.72681, + "r_x0": 157.66666666666669, + "r_y0": 680.3333333333334, + "r_x1": 157.66666666666669, + "r_y1": 610.0, + "r_x2": 137.0, + "r_y2": 610.0, + "r_x3": 137.0, + "r_y3": 680.3333333333334, "coord_origin": "TOPLEFT" }, - "text": "Theteststartswithsomerandomtextandthenatableimage: ", - "orig": "Theteststartswithsomerandomtextandthenatableimage: ", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - } - ], - "children": [] - }, - { - "id": 8, - "label": "form", - "bbox": { - "l": 182.33333333333334, - "t": 133.0, - "r": 283.66666666666663, - "b": 451.6666666666667, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.7344542741775513, - "cells": [ + "confidence": 92.0, + "from_ocr": true + }, { "index": 2, "rgba": { @@ -621,20 +541,20 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 337.0, - "r_x1": 191.0, - "r_y1": 308.0, - "r_x2": 182.33333333333334, - "r_y2": 308.0, - "r_x3": 182.33333333333334, - "r_y3": 337.0, + "r_x0": 220.0, + "r_y0": 670.3333333333334, + "r_x1": 220.0, + "r_y1": 623.3333333333334, + "r_x2": 204.0, + "r_y2": 623.3333333333334, + "r_x3": 204.0, + "r_y3": 670.3333333333334, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9576889799999999, + "confidence": 96.0, "from_ocr": true }, { @@ -646,20 +566,20 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 304.0, - "r_x1": 191.0, - "r_y1": 268.33333333333337, - "r_x2": 182.33333333333334, - "r_y2": 268.33333333333337, - "r_x3": 182.33333333333334, - "r_y3": 304.0, + "r_x0": 300.0, + "r_y0": 670.3333333333334, + "r_x1": 300.0, + "r_y1": 623.3333333333334, + "r_x2": 284.0, + "r_y2": 623.3333333333334, + "r_x3": 284.0, + "r_y3": 670.3333333333334, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9576889799999999, + "confidence": 96.0, "from_ocr": true }, { @@ -671,20 +591,20 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 230.66666666666666, - "r_x1": 191.0, - "r_y1": 201.66666666666669, - "r_x2": 182.33333333333334, - "r_y2": 201.66666666666669, - "r_x3": 182.33333333333334, - "r_y3": 230.66666666666666, + "r_x0": 126.33333333333334, + "r_y0": 559.6666666666667, + "r_x1": 126.33333333333334, + "r_y1": 428.0, + "r_x2": 105.66666666666666, + "r_y2": 428.0, + "r_x3": 105.66666666666666, + "r_y3": 559.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 0.9617948900000001, + "confidence": 91.0, "from_ocr": true }, { @@ -696,20 +616,20 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 197.66666666666669, - "r_x1": 191.0, - "r_y1": 172.0, - "r_x2": 182.33333333333334, - "r_y2": 172.0, - "r_x3": 182.33333333333334, - "r_y3": 197.66666666666669, + "r_x0": 153.0, + "r_y0": 526.6666666666667, + "r_x1": 153.0, + "r_y1": 456.0, + "r_x2": 137.0, + "r_y2": 456.0, + "r_x3": 137.0, + "r_y3": 526.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.96105423, + "confidence": 95.0, "from_ocr": true }, { @@ -721,20 +641,20 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 168.66666666666669, - "r_x1": 191.0, - "r_y1": 133.0, - "r_x2": 182.33333333333334, - "r_y2": 133.0, - "r_x3": 182.33333333333334, - "r_y3": 168.66666666666669, + "r_x0": 204.33333333333334, + "r_y0": 545.0, + "r_x1": 204.33333333333334, + "r_y1": 442.3333333333333, + "r_x2": 188.33333333333331, + "r_y2": 442.3333333333333, + "r_x3": 188.33333333333331, + "r_y3": 545.0, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.95868614, + "confidence": 95.0, "from_ocr": true }, { @@ -746,20 +666,20 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 437.3333333333333, - "r_x1": 237.33333333333331, - "r_y1": 408.3333333333333, - "r_x2": 228.66666666666669, - "r_y2": 408.3333333333333, - "r_x3": 228.66666666666669, - "r_y3": 437.3333333333333, + "r_x0": 236.0, + "r_y0": 515.0, + "r_x1": 236.0, + "r_y1": 468.0, + "r_x2": 220.0, + "r_y2": 468.0, + "r_x3": 220.0, + "r_y3": 515.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9579908, + "confidence": 96.0, "from_ocr": true }, { @@ -771,20 +691,20 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 404.0, - "r_x1": 237.33333333333331, - "r_y1": 386.3333333333333, - "r_x2": 231.0, - "r_y2": 386.3333333333333, - "r_x3": 231.0, - "r_y3": 404.0, + "r_x0": 284.0, + "r_y0": 545.0, + "r_x1": 284.0, + "r_y1": 442.3333333333333, + "r_x2": 268.0, + "r_y2": 442.3333333333333, + "r_x3": 268.0, + "r_y3": 545.0, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.96640068, + "confidence": 93.0, "from_ocr": true }, { @@ -796,20 +716,20 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 326.33333333333337, - "r_x1": 237.33333333333331, - "r_y1": 299.0, - "r_x2": 231.0, - "r_y2": 299.0, - "r_x3": 231.0, - "r_y3": 326.33333333333337, + "r_x0": 315.33333333333337, + "r_y0": 515.0, + "r_x1": 315.33333333333337, + "r_y1": 468.0, + "r_x2": 299.66666666666663, + "r_y2": 468.0, + "r_x3": 299.66666666666663, + "r_y3": 515.0, "coord_origin": "TOPLEFT" }, - "text": "some", - "orig": "some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96376541, + "confidence": 96.0, "from_ocr": true }, { @@ -821,20 +741,20 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 295.33333333333337, - "r_x1": 237.33333333333331, - "r_y1": 279.0, - "r_x2": 228.66666666666669, - "r_y2": 279.0, - "r_x3": 228.66666666666669, - "r_y3": 295.33333333333337, + "r_x0": 121.66666666666666, + "r_y0": 385.6666666666667, + "r_x1": 121.66666666666666, + "r_y1": 274.0, + "r_x2": 105.66666666666666, + "r_y2": 274.0, + "r_x3": 105.66666666666666, + "r_y3": 385.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "cell", - "orig": "cell", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.95824509, + "confidence": 95.0, "from_ocr": true }, { @@ -846,20 +766,20 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 213.66666666666666, - "r_x1": 237.33333333333331, - "r_y1": 190.0, - "r_x2": 228.66666666666669, - "r_y2": 190.0, - "r_x3": 228.66666666666669, - "r_y3": 213.66666666666666, + "r_x0": 153.0, + "r_y0": 363.0, + "r_x1": 153.0, + "r_y1": 292.66666666666663, + "r_x2": 137.0, + "r_y2": 292.66666666666663, + "r_x3": 137.0, + "r_y3": 363.0, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9643471499999999, + "confidence": 94.0, "from_ocr": true }, { @@ -871,20 +791,20 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 186.0, - "r_x1": 237.33333333333331, - "r_y1": 149.0, - "r_x2": 229.0, - "r_y2": 149.0, - "r_x3": 229.0, - "r_y3": 186.0, + "r_x0": 204.33333333333334, + "r_y0": 384.0, + "r_x1": 204.33333333333334, + "r_y1": 278.0, + "r_x2": 188.33333333333331, + "r_y2": 278.0, + "r_x3": 188.33333333333331, + "r_y3": 384.0, "coord_origin": "TOPLEFT" }, - "text": "content", - "orig": "content", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.96289528, + "confidence": 95.0, "from_ocr": true }, { @@ -896,20 +816,20 @@ "a": 255 }, "rect": { - "r_x0": 283.66666666666663, - "r_y0": 451.6666666666667, - "r_x1": 283.66666666666663, - "r_y1": 422.6666666666667, - "r_x2": 275.0, - "r_y2": 422.6666666666667, - "r_x3": 275.0, - "r_y3": 451.6666666666667, + "r_x0": 236.0, + "r_y0": 351.33333333333337, + "r_x1": 236.0, + "r_y1": 304.33333333333337, + "r_x2": 220.0, + "r_y2": 304.33333333333337, + "r_x3": 220.0, + "r_y3": 351.33333333333337, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9611363199999999, + "confidence": 95.0, "from_ocr": true }, { @@ -921,20 +841,20 @@ "a": 255 }, "rect": { - "r_x0": 283.66666666666663, - "r_y0": 419.0, - "r_x1": 283.66666666666663, - "r_y1": 393.0, - "r_x2": 275.0, - "r_y2": 393.0, - "r_x3": 275.0, - "r_y3": 419.0, + "r_x0": 284.0, + "r_y0": 383.6666666666667, + "r_x1": 284.0, + "r_y1": 278.0, + "r_x2": 268.0, + "r_y2": 278.0, + "r_x3": 268.0, + "r_y3": 383.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.9588653600000001, + "confidence": 95.0, "from_ocr": true }, { @@ -946,85 +866,115 @@ "a": 255 }, "rect": { - "r_x0": 283.66666666666663, - "r_y0": 389.3333333333333, - "r_x1": 283.66666666666663, - "r_y1": 371.6666666666667, - "r_x2": 277.33333333333337, - "r_y2": 371.6666666666667, - "r_x3": 277.33333333333337, - "r_y3": 389.3333333333333, + "r_x0": 315.33333333333337, + "r_y0": 351.33333333333337, + "r_x1": 315.33333333333337, + "r_y1": 304.33333333333337, + "r_x2": 299.66666666666663, + "r_y2": 304.33333333333337, + "r_x3": 299.66666666666663, + "r_y3": 351.33333333333337, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.95681549, - "from_ocr": true - }, - { - "index": 16, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 283.66666666666663, - "r_y0": 329.0, - "r_x1": 283.66666666666663, - "r_y1": 303.0, - "r_x2": 275.0, - "r_y2": 303.0, - "r_x3": 275.0, - "r_y3": 329.0, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.9589106, - "from_ocr": true - }, - { - "index": 17, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 283.66666666666663, - "r_y0": 299.66666666666663, - "r_x1": 283.66666666666663, - "r_y1": 275.66666666666663, - "r_x2": 275.0, - "r_y2": 275.66666666666663, - "r_x3": 275.0, - "r_y3": 299.66666666666663, - "coord_origin": "TOPLEFT" - }, - "text": "don't", - "orig": "don't", - "text_direction": "left_to_right", - "confidence": 0.96121948, + "confidence": 95.0, "from_ocr": true } ], "children": [ { - "id": 4, + "id": 1, "label": "text", "bbox": { - "l": 182.33333333333334, - "t": 268.33333333333337, - "r": 191.0, - "b": 337.0, + "l": 105.66666666666666, + "t": 602.0, + "r": 126.33333333333334, + "b": 694.6666666666666, "coord_origin": "TOPLEFT" }, - "confidence": 0.9089116454124451, + "confidence": 90.0, + "cells": [ + { + "index": 0, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 126.33333333333334, + "r_y0": 694.6666666666666, + "r_x1": 126.33333333333334, + "r_y1": 602.0, + "r_x2": 105.66666666666666, + "r_y2": 602.0, + "r_x3": 105.66666666666666, + "r_y3": 694.6666666666666, + "coord_origin": "TOPLEFT" + }, + "text": "Vertically", + "orig": "Vertically", + "text_direction": "left_to_right", + "confidence": 90.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 2, + "label": "text", + "bbox": { + "l": 137.0, + "t": 610.0, + "r": 157.66666666666669, + "b": 680.3333333333334, + "coord_origin": "TOPLEFT" + }, + "confidence": 92.0, + "cells": [ + { + "index": 1, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 157.66666666666669, + "r_y0": 680.3333333333334, + "r_x1": 157.66666666666669, + "r_y1": 610.0, + "r_x2": 137.0, + "r_y2": 610.0, + "r_x3": 137.0, + "r_y3": 680.3333333333334, + "coord_origin": "TOPLEFT" + }, + "text": "merged", + "orig": "merged", + "text_direction": "left_to_right", + "confidence": 92.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 3, + "label": "text", + "bbox": { + "l": 204.0, + "t": 623.3333333333334, + "r": 220.0, + "b": 670.3333333333334, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, "cells": [ { "index": 2, @@ -1035,22 +985,37 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 337.0, - "r_x1": 191.0, - "r_y1": 308.0, - "r_x2": 182.33333333333334, - "r_y2": 308.0, - "r_x3": 182.33333333333334, - "r_y3": 337.0, + "r_x0": 220.0, + "r_y0": 670.3333333333334, + "r_x1": 220.0, + "r_y1": 623.3333333333334, + "r_x2": 204.0, + "r_y2": 623.3333333333334, + "r_x3": 204.0, + "r_y3": 670.3333333333334, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9576889799999999, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 4, + "label": "text", + "bbox": { + "l": 284.0, + "t": 623.3333333333334, + "r": 300.0, + "b": 670.3333333333334, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ { "index": 3, "rgba": { @@ -1060,20 +1025,20 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 304.0, - "r_x1": 191.0, - "r_y1": 268.33333333333337, - "r_x2": 182.33333333333334, - "r_y2": 268.33333333333337, - "r_x3": 182.33333333333334, - "r_y3": 304.0, + "r_x0": 300.0, + "r_y0": 670.3333333333334, + "r_x1": 300.0, + "r_y1": 623.3333333333334, + "r_x2": 284.0, + "r_y2": 623.3333333333334, + "r_x3": 284.0, + "r_y3": 670.3333333333334, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9576889799999999, + "confidence": 96.0, "from_ocr": true } ], @@ -1083,13 +1048,13 @@ "id": 5, "label": "text", "bbox": { - "l": 182.33333333333334, - "t": 133.0, - "r": 191.0, - "b": 230.66666666666666, + "l": 105.66666666666666, + "t": 428.0, + "r": 126.33333333333334, + "b": 559.6666666666667, "coord_origin": "TOPLEFT" }, - "confidence": 0.9040389060974121, + "confidence": 91.0, "cells": [ { "index": 4, @@ -1100,22 +1065,37 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 230.66666666666666, - "r_x1": 191.0, - "r_y1": 201.66666666666669, - "r_x2": 182.33333333333334, - "r_y2": 201.66666666666669, - "r_x3": 182.33333333333334, - "r_y3": 230.66666666666666, + "r_x0": 126.33333333333334, + "r_y0": 559.6666666666667, + "r_x1": 126.33333333333334, + "r_y1": 428.0, + "r_x2": 105.66666666666666, + "r_y2": 428.0, + "r_x3": 105.66666666666666, + "r_y3": 559.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 0.9617948900000001, + "confidence": 91.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 6, + "label": "text", + "bbox": { + "l": 137.0, + "t": 456.0, + "r": 153.0, + "b": 526.6666666666667, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 5, "rgba": { @@ -1125,22 +1105,37 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 197.66666666666669, - "r_x1": 191.0, - "r_y1": 172.0, - "r_x2": 182.33333333333334, - "r_y2": 172.0, - "r_x3": 182.33333333333334, - "r_y3": 197.66666666666669, + "r_x0": 153.0, + "r_y0": 526.6666666666667, + "r_x1": 153.0, + "r_y1": 456.0, + "r_x2": 137.0, + "r_y2": 456.0, + "r_x3": 137.0, + "r_y3": 526.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.96105423, + "confidence": 95.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 7, + "label": "text", + "bbox": { + "l": 188.33333333333331, + "t": 442.3333333333333, + "r": 204.33333333333334, + "b": 545.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 6, "rgba": { @@ -1150,36 +1145,36 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 168.66666666666669, - "r_x1": 191.0, - "r_y1": 133.0, - "r_x2": 182.33333333333334, - "r_y2": 133.0, - "r_x3": 182.33333333333334, - "r_y3": 168.66666666666669, + "r_x0": 204.33333333333334, + "r_y0": 545.0, + "r_x1": 204.33333333333334, + "r_y1": 442.3333333333333, + "r_x2": 188.33333333333331, + "r_y2": 442.3333333333333, + "r_x3": 188.33333333333331, + "r_y3": 545.0, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.95868614, + "confidence": 95.0, "from_ocr": true } ], "children": [] }, { - "id": 0, + "id": 8, "label": "text", "bbox": { - "l": 228.66666666666669, - "t": 386.3333333333333, - "r": 237.33333333333331, - "b": 437.3333333333333, + "l": 220.0, + "t": 468.0, + "r": 236.0, + "b": 515.0, "coord_origin": "TOPLEFT" }, - "confidence": 0.9155756235122681, + "confidence": 96.0, "cells": [ { "index": 7, @@ -1190,22 +1185,37 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 437.3333333333333, - "r_x1": 237.33333333333331, - "r_y1": 408.3333333333333, - "r_x2": 228.66666666666669, - "r_y2": 408.3333333333333, - "r_x3": 228.66666666666669, - "r_y3": 437.3333333333333, + "r_x0": 236.0, + "r_y0": 515.0, + "r_x1": 236.0, + "r_y1": 468.0, + "r_x2": 220.0, + "r_y2": 468.0, + "r_x3": 220.0, + "r_y3": 515.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9579908, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 9, + "label": "text", + "bbox": { + "l": 268.0, + "t": 442.3333333333333, + "r": 284.0, + "b": 545.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 93.0, + "cells": [ { "index": 8, "rgba": { @@ -1215,36 +1225,36 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 404.0, - "r_x1": 237.33333333333331, - "r_y1": 386.3333333333333, - "r_x2": 231.0, - "r_y2": 386.3333333333333, - "r_x3": 231.0, - "r_y3": 404.0, + "r_x0": 284.0, + "r_y0": 545.0, + "r_x1": 284.0, + "r_y1": 442.3333333333333, + "r_x2": 268.0, + "r_y2": 442.3333333333333, + "r_x3": 268.0, + "r_y3": 545.0, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.96640068, + "confidence": 93.0, "from_ocr": true } ], "children": [] }, { - "id": 2, + "id": 10, "label": "text", "bbox": { - "l": 228.66666666666669, - "t": 279.0, - "r": 237.33333333333331, - "b": 326.33333333333337, + "l": 299.66666666666663, + "t": 468.0, + "r": 315.33333333333337, + "b": 515.0, "coord_origin": "TOPLEFT" }, - "confidence": 0.9143174290657043, + "confidence": 96.0, "cells": [ { "index": 9, @@ -1255,22 +1265,37 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 326.33333333333337, - "r_x1": 237.33333333333331, - "r_y1": 299.0, - "r_x2": 231.0, - "r_y2": 299.0, - "r_x3": 231.0, - "r_y3": 326.33333333333337, + "r_x0": 315.33333333333337, + "r_y0": 515.0, + "r_x1": 315.33333333333337, + "r_y1": 468.0, + "r_x2": 299.66666666666663, + "r_y2": 468.0, + "r_x3": 299.66666666666663, + "r_y3": 515.0, "coord_origin": "TOPLEFT" }, - "text": "some", - "orig": "some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96376541, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 11, + "label": "text", + "bbox": { + "l": 105.66666666666666, + "t": 274.0, + "r": 121.66666666666666, + "b": 385.6666666666667, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 10, "rgba": { @@ -1280,36 +1305,36 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 295.33333333333337, - "r_x1": 237.33333333333331, - "r_y1": 279.0, - "r_x2": 228.66666666666669, - "r_y2": 279.0, - "r_x3": 228.66666666666669, - "r_y3": 295.33333333333337, + "r_x0": 121.66666666666666, + "r_y0": 385.6666666666667, + "r_x1": 121.66666666666666, + "r_y1": 274.0, + "r_x2": 105.66666666666666, + "r_y2": 274.0, + "r_x3": 105.66666666666666, + "r_y3": 385.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "cell", - "orig": "cell", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.95824509, + "confidence": 95.0, "from_ocr": true } ], "children": [] }, { - "id": 6, + "id": 12, "label": "text", "bbox": { - "l": 228.66666666666669, - "t": 149.0, - "r": 237.33333333333331, - "b": 213.66666666666666, + "l": 137.0, + "t": 292.66666666666663, + "r": 153.0, + "b": 363.0, "coord_origin": "TOPLEFT" }, - "confidence": 0.9003775715827942, + "confidence": 94.0, "cells": [ { "index": 11, @@ -1320,22 +1345,37 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 213.66666666666666, - "r_x1": 237.33333333333331, - "r_y1": 190.0, - "r_x2": 228.66666666666669, - "r_y2": 190.0, - "r_x3": 228.66666666666669, - "r_y3": 213.66666666666666, + "r_x0": 153.0, + "r_y0": 363.0, + "r_x1": 153.0, + "r_y1": 292.66666666666663, + "r_x2": 137.0, + "r_y2": 292.66666666666663, + "r_x3": 137.0, + "r_y3": 363.0, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9643471499999999, + "confidence": 94.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 13, + "label": "text", + "bbox": { + "l": 188.33333333333331, + "t": 278.0, + "r": 204.33333333333334, + "b": 384.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 12, "rgba": { @@ -1345,36 +1385,36 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 186.0, - "r_x1": 237.33333333333331, - "r_y1": 149.0, - "r_x2": 229.0, - "r_y2": 149.0, - "r_x3": 229.0, - "r_y3": 186.0, + "r_x0": 204.33333333333334, + "r_y0": 384.0, + "r_x1": 204.33333333333334, + "r_y1": 278.0, + "r_x2": 188.33333333333331, + "r_y2": 278.0, + "r_x3": 188.33333333333331, + "r_y3": 384.0, "coord_origin": "TOPLEFT" }, - "text": "content", - "orig": "content", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.96289528, + "confidence": 95.0, "from_ocr": true } ], "children": [] }, { - "id": 1, + "id": 14, "label": "text", "bbox": { - "l": 275.0, - "t": 371.6666666666667, - "r": 283.66666666666663, - "b": 451.6666666666667, + "l": 220.0, + "t": 304.33333333333337, + "r": 236.0, + "b": 351.33333333333337, "coord_origin": "TOPLEFT" }, - "confidence": 0.9147250652313232, + "confidence": 95.0, "cells": [ { "index": 13, @@ -1385,22 +1425,37 @@ "a": 255 }, "rect": { - "r_x0": 283.66666666666663, - "r_y0": 451.6666666666667, - "r_x1": 283.66666666666663, - "r_y1": 422.6666666666667, - "r_x2": 275.0, - "r_y2": 422.6666666666667, - "r_x3": 275.0, - "r_y3": 451.6666666666667, + "r_x0": 236.0, + "r_y0": 351.33333333333337, + "r_x1": 236.0, + "r_y1": 304.33333333333337, + "r_x2": 220.0, + "r_y2": 304.33333333333337, + "r_x3": 220.0, + "r_y3": 351.33333333333337, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9611363199999999, + "confidence": 95.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 15, + "label": "text", + "bbox": { + "l": 268.0, + "t": 278.0, + "r": 284.0, + "b": 383.6666666666667, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 14, "rgba": { @@ -1410,22 +1465,37 @@ "a": 255 }, "rect": { - "r_x0": 283.66666666666663, - "r_y0": 419.0, - "r_x1": 283.66666666666663, - "r_y1": 393.0, - "r_x2": 275.0, - "r_y2": 393.0, - "r_x3": 275.0, - "r_y3": 419.0, + "r_x0": 284.0, + "r_y0": 383.6666666666667, + "r_x1": 284.0, + "r_y1": 278.0, + "r_x2": 268.0, + "r_y2": 278.0, + "r_x3": 268.0, + "r_y3": 383.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.9588653600000001, + "confidence": 95.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 16, + "label": "text", + "bbox": { + "l": 299.66666666666663, + "t": 304.33333333333337, + "r": 315.33333333333337, + "b": 351.33333333333337, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 15, "rgba": { @@ -1435,85 +1505,20 @@ "a": 255 }, "rect": { - "r_x0": 283.66666666666663, - "r_y0": 389.3333333333333, - "r_x1": 283.66666666666663, - "r_y1": 371.6666666666667, - "r_x2": 277.33333333333337, - "r_y2": 371.6666666666667, - "r_x3": 277.33333333333337, - "r_y3": 389.3333333333333, + "r_x0": 315.33333333333337, + "r_y0": 351.33333333333337, + "r_x1": 315.33333333333337, + "r_y1": 304.33333333333337, + "r_x2": 299.66666666666663, + "r_y2": 304.33333333333337, + "r_x3": 299.66666666666663, + "r_y3": 351.33333333333337, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.95681549, - "from_ocr": true - } - ], - "children": [] - }, - { - "id": 3, - "label": "text", - "bbox": { - "l": 275.0, - "t": 275.66666666666663, - "r": 283.66666666666663, - "b": 329.0, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.9124712347984314, - "cells": [ - { - "index": 16, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 283.66666666666663, - "r_y0": 329.0, - "r_x1": 283.66666666666663, - "r_y1": 303.0, - "r_x2": 275.0, - "r_y2": 303.0, - "r_x3": 275.0, - "r_y3": 329.0, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.9589106, - "from_ocr": true - }, - { - "index": 17, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 283.66666666666663, - "r_y0": 299.66666666666663, - "r_x1": 283.66666666666663, - "r_y1": 275.66666666666663, - "r_x2": 275.0, - "r_y2": 275.66666666666663, - "r_x3": 275.0, - "r_y3": 299.66666666666663, - "coord_origin": "TOPLEFT" - }, - "text": "don't", - "orig": "don't", - "text_direction": "left_to_right", - "confidence": 0.96121948, + "confidence": 95.0, "from_ocr": true } ], @@ -1524,7 +1529,1087 @@ ] }, "tablestructure": { - "table_map": {} + "table_map": { + "0": { + "label": "table", + "id": 0, + "page_no": 0, + "cluster": { + "id": 0, + "label": "table", + "bbox": { + "l": 87.64582824707031, + "t": 240.90216064453125, + "r": 334.5821228027344, + "b": 722.9614028930664, + "coord_origin": "TOPLEFT" + }, + "confidence": 0.9790208339691162, + "cells": [ + { + "index": 0, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 126.33333333333334, + "r_y0": 694.6666666666666, + "r_x1": 126.33333333333334, + "r_y1": 602.0, + "r_x2": 105.66666666666666, + "r_y2": 602.0, + "r_x3": 105.66666666666666, + "r_y3": 694.6666666666666, + "coord_origin": "TOPLEFT" + }, + "text": "Vertically", + "orig": "Vertically", + "text_direction": "left_to_right", + "confidence": 90.0, + "from_ocr": true + }, + { + "index": 1, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 157.66666666666669, + "r_y0": 680.3333333333334, + "r_x1": 157.66666666666669, + "r_y1": 610.0, + "r_x2": 137.0, + "r_y2": 610.0, + "r_x3": 137.0, + "r_y3": 680.3333333333334, + "coord_origin": "TOPLEFT" + }, + "text": "merged", + "orig": "merged", + "text_direction": "left_to_right", + "confidence": 92.0, + "from_ocr": true + }, + { + "index": 2, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 220.0, + "r_y0": 670.3333333333334, + "r_x1": 220.0, + "r_y1": 623.3333333333334, + "r_x2": 204.0, + "r_y2": 623.3333333333334, + "r_x3": 204.0, + "r_y3": 670.3333333333334, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + }, + { + "index": 3, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 300.0, + "r_y0": 670.3333333333334, + "r_x1": 300.0, + "r_y1": 623.3333333333334, + "r_x2": 284.0, + "r_y2": 623.3333333333334, + "r_x3": 284.0, + "r_y3": 670.3333333333334, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + }, + { + "index": 4, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 126.33333333333334, + "r_y0": 559.6666666666667, + "r_x1": 126.33333333333334, + "r_y1": 428.0, + "r_x2": 105.66666666666666, + "r_y2": 428.0, + "r_x3": 105.66666666666666, + "r_y3": 559.6666666666667, + "coord_origin": "TOPLEFT" + }, + "text": "Other merged", + "orig": "Other merged", + "text_direction": "left_to_right", + "confidence": 91.0, + "from_ocr": true + }, + { + "index": 5, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 153.0, + "r_y0": 526.6666666666667, + "r_x1": 153.0, + "r_y1": 456.0, + "r_x2": 137.0, + "r_y2": 456.0, + "r_x3": 137.0, + "r_y3": 526.6666666666667, + "coord_origin": "TOPLEFT" + }, + "text": "column", + "orig": "column", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 6, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 204.33333333333334, + "r_y0": 545.0, + "r_x1": 204.33333333333334, + "r_y1": 442.3333333333333, + "r_x2": 188.33333333333331, + "r_y2": 442.3333333333333, + "r_x3": 188.33333333333331, + "r_y3": 545.0, + "coord_origin": "TOPLEFT" + }, + "text": "Some other", + "orig": "Some other", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 7, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 236.0, + "r_y0": 515.0, + "r_x1": 236.0, + "r_y1": 468.0, + "r_x2": 220.0, + "r_y2": 468.0, + "r_x3": 220.0, + "r_y3": 515.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + }, + { + "index": 8, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 284.0, + "r_y0": 545.0, + "r_x1": 284.0, + "r_y1": 442.3333333333333, + "r_x2": 268.0, + "r_y2": 442.3333333333333, + "r_x3": 268.0, + "r_y3": 545.0, + "coord_origin": "TOPLEFT" + }, + "text": "Some other", + "orig": "Some other", + "text_direction": "left_to_right", + "confidence": 93.0, + "from_ocr": true + }, + { + "index": 9, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 315.33333333333337, + "r_y0": 515.0, + "r_x1": 315.33333333333337, + "r_y1": 468.0, + "r_x2": 299.66666666666663, + "r_y2": 468.0, + "r_x3": 299.66666666666663, + "r_y3": 515.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + }, + { + "index": 10, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 121.66666666666666, + "r_y0": 385.6666666666667, + "r_x1": 121.66666666666666, + "r_y1": 274.0, + "r_x2": 105.66666666666666, + "r_y2": 274.0, + "r_x3": 105.66666666666666, + "r_y3": 385.6666666666667, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 11, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 153.0, + "r_y0": 363.0, + "r_x1": 153.0, + "r_y1": 292.66666666666663, + "r_x2": 137.0, + "r_y2": 292.66666666666663, + "r_x3": 137.0, + "r_y3": 363.0, + "coord_origin": "TOPLEFT" + }, + "text": "column", + "orig": "column", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + }, + { + "index": 12, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 204.33333333333334, + "r_y0": 384.0, + "r_x1": 204.33333333333334, + "r_y1": 278.0, + "r_x2": 188.33333333333331, + "r_y2": 278.0, + "r_x3": 188.33333333333331, + "r_y3": 384.0, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 236.0, + "r_y0": 351.33333333333337, + "r_x1": 236.0, + "r_y1": 304.33333333333337, + "r_x2": 220.0, + "r_y2": 304.33333333333337, + "r_x3": 220.0, + "r_y3": 351.33333333333337, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 284.0, + "r_y0": 383.6666666666667, + "r_x1": 284.0, + "r_y1": 278.0, + "r_x2": 268.0, + "r_y2": 278.0, + "r_x3": 268.0, + "r_y3": 383.6666666666667, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 315.33333333333337, + "r_y0": 351.33333333333337, + "r_x1": 315.33333333333337, + "r_y1": 304.33333333333337, + "r_x2": 299.66666666666663, + "r_y2": 304.33333333333337, + "r_x3": 299.66666666666663, + "r_y3": 351.33333333333337, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [ + { + "id": 1, + "label": "text", + "bbox": { + "l": 105.66666666666666, + "t": 602.0, + "r": 126.33333333333334, + "b": 694.6666666666666, + "coord_origin": "TOPLEFT" + }, + "confidence": 90.0, + "cells": [ + { + "index": 0, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 126.33333333333334, + "r_y0": 694.6666666666666, + "r_x1": 126.33333333333334, + "r_y1": 602.0, + "r_x2": 105.66666666666666, + "r_y2": 602.0, + "r_x3": 105.66666666666666, + "r_y3": 694.6666666666666, + "coord_origin": "TOPLEFT" + }, + "text": "Vertically", + "orig": "Vertically", + "text_direction": "left_to_right", + "confidence": 90.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 2, + "label": "text", + "bbox": { + "l": 137.0, + "t": 610.0, + "r": 157.66666666666669, + "b": 680.3333333333334, + "coord_origin": "TOPLEFT" + }, + "confidence": 92.0, + "cells": [ + { + "index": 1, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 157.66666666666669, + "r_y0": 680.3333333333334, + "r_x1": 157.66666666666669, + "r_y1": 610.0, + "r_x2": 137.0, + "r_y2": 610.0, + "r_x3": 137.0, + "r_y3": 680.3333333333334, + "coord_origin": "TOPLEFT" + }, + "text": "merged", + "orig": "merged", + "text_direction": "left_to_right", + "confidence": 92.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 3, + "label": "text", + "bbox": { + "l": 204.0, + "t": 623.3333333333334, + "r": 220.0, + "b": 670.3333333333334, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ + { + "index": 2, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 220.0, + "r_y0": 670.3333333333334, + "r_x1": 220.0, + "r_y1": 623.3333333333334, + "r_x2": 204.0, + "r_y2": 623.3333333333334, + "r_x3": 204.0, + "r_y3": 670.3333333333334, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 4, + "label": "text", + "bbox": { + "l": 284.0, + "t": 623.3333333333334, + "r": 300.0, + "b": 670.3333333333334, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ + { + "index": 3, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 300.0, + "r_y0": 670.3333333333334, + "r_x1": 300.0, + "r_y1": 623.3333333333334, + "r_x2": 284.0, + "r_y2": 623.3333333333334, + "r_x3": 284.0, + "r_y3": 670.3333333333334, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 5, + "label": "text", + "bbox": { + "l": 105.66666666666666, + "t": 428.0, + "r": 126.33333333333334, + "b": 559.6666666666667, + "coord_origin": "TOPLEFT" + }, + "confidence": 91.0, + "cells": [ + { + "index": 4, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 126.33333333333334, + "r_y0": 559.6666666666667, + "r_x1": 126.33333333333334, + "r_y1": 428.0, + "r_x2": 105.66666666666666, + "r_y2": 428.0, + "r_x3": 105.66666666666666, + "r_y3": 559.6666666666667, + "coord_origin": "TOPLEFT" + }, + "text": "Other merged", + "orig": "Other merged", + "text_direction": "left_to_right", + "confidence": 91.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 6, + "label": "text", + "bbox": { + "l": 137.0, + "t": 456.0, + "r": 153.0, + "b": 526.6666666666667, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 5, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 153.0, + "r_y0": 526.6666666666667, + "r_x1": 153.0, + "r_y1": 456.0, + "r_x2": 137.0, + "r_y2": 456.0, + "r_x3": 137.0, + "r_y3": 526.6666666666667, + "coord_origin": "TOPLEFT" + }, + "text": "column", + "orig": "column", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 7, + "label": "text", + "bbox": { + "l": 188.33333333333331, + "t": 442.3333333333333, + "r": 204.33333333333334, + "b": 545.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 6, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 204.33333333333334, + "r_y0": 545.0, + "r_x1": 204.33333333333334, + "r_y1": 442.3333333333333, + "r_x2": 188.33333333333331, + "r_y2": 442.3333333333333, + "r_x3": 188.33333333333331, + "r_y3": 545.0, + "coord_origin": "TOPLEFT" + }, + "text": "Some other", + "orig": "Some other", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 8, + "label": "text", + "bbox": { + "l": 220.0, + "t": 468.0, + "r": 236.0, + "b": 515.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ + { + "index": 7, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 236.0, + "r_y0": 515.0, + "r_x1": 236.0, + "r_y1": 468.0, + "r_x2": 220.0, + "r_y2": 468.0, + "r_x3": 220.0, + "r_y3": 515.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 9, + "label": "text", + "bbox": { + "l": 268.0, + "t": 442.3333333333333, + "r": 284.0, + "b": 545.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 93.0, + "cells": [ + { + "index": 8, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 284.0, + "r_y0": 545.0, + "r_x1": 284.0, + "r_y1": 442.3333333333333, + "r_x2": 268.0, + "r_y2": 442.3333333333333, + "r_x3": 268.0, + "r_y3": 545.0, + "coord_origin": "TOPLEFT" + }, + "text": "Some other", + "orig": "Some other", + "text_direction": "left_to_right", + "confidence": 93.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 10, + "label": "text", + "bbox": { + "l": 299.66666666666663, + "t": 468.0, + "r": 315.33333333333337, + "b": 515.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ + { + "index": 9, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 315.33333333333337, + "r_y0": 515.0, + "r_x1": 315.33333333333337, + "r_y1": 468.0, + "r_x2": 299.66666666666663, + "r_y2": 468.0, + "r_x3": 299.66666666666663, + "r_y3": 515.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 11, + "label": "text", + "bbox": { + "l": 105.66666666666666, + "t": 274.0, + "r": 121.66666666666666, + "b": 385.6666666666667, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 10, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 121.66666666666666, + "r_y0": 385.6666666666667, + "r_x1": 121.66666666666666, + "r_y1": 274.0, + "r_x2": 105.66666666666666, + "r_y2": 274.0, + "r_x3": 105.66666666666666, + "r_y3": 385.6666666666667, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 12, + "label": "text", + "bbox": { + "l": 137.0, + "t": 292.66666666666663, + "r": 153.0, + "b": 363.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ + { + "index": 11, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 153.0, + "r_y0": 363.0, + "r_x1": 153.0, + "r_y1": 292.66666666666663, + "r_x2": 137.0, + "r_y2": 292.66666666666663, + "r_x3": 137.0, + "r_y3": 363.0, + "coord_origin": "TOPLEFT" + }, + "text": "column", + "orig": "column", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 13, + "label": "text", + "bbox": { + "l": 188.33333333333331, + "t": 278.0, + "r": 204.33333333333334, + "b": 384.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 12, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 204.33333333333334, + "r_y0": 384.0, + "r_x1": 204.33333333333334, + "r_y1": 278.0, + "r_x2": 188.33333333333331, + "r_y2": 278.0, + "r_x3": 188.33333333333331, + "r_y3": 384.0, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 14, + "label": "text", + "bbox": { + "l": 220.0, + "t": 304.33333333333337, + "r": 236.0, + "b": 351.33333333333337, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 236.0, + "r_y0": 351.33333333333337, + "r_x1": 236.0, + "r_y1": 304.33333333333337, + "r_x2": 220.0, + "r_y2": 304.33333333333337, + "r_x3": 220.0, + "r_y3": 351.33333333333337, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 15, + "label": "text", + "bbox": { + "l": 268.0, + "t": 278.0, + "r": 284.0, + "b": 383.6666666666667, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 284.0, + "r_y0": 383.6666666666667, + "r_x1": 284.0, + "r_y1": 278.0, + "r_x2": 268.0, + "r_y2": 278.0, + "r_x3": 268.0, + "r_y3": 383.6666666666667, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 16, + "label": "text", + "bbox": { + "l": 299.66666666666663, + "t": 304.33333333333337, + "r": 315.33333333333337, + "b": 351.33333333333337, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 315.33333333333337, + "r_y0": 351.33333333333337, + "r_x1": 315.33333333333337, + "r_y1": 304.33333333333337, + "r_x2": 299.66666666666663, + "r_y2": 304.33333333333337, + "r_x3": 299.66666666666663, + "r_y3": 351.33333333333337, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + } + ] + }, + "text": null, + "otsl_seq": [ + "ched", + "ched", + "ched", + "nl", + "fcel", + "fcel", + "fcel", + "nl", + "fcel", + "fcel", + "fcel", + "nl" + ], + "num_rows": 0, + "num_cols": 0, + "table_cells": [] + } + } }, "figures_classification": null, "equations_prediction": null, @@ -1533,20 +2618,20 @@ "assembled": { "elements": [ { - "label": "section_header", - "id": 9, + "label": "table", + "id": 0, "page_no": 0, "cluster": { - "id": 9, - "label": "section_header", + "id": 0, + "label": "table", "bbox": { - "l": 72.850723, - "t": 194.03978999999998, - "r": 101.89737999999998, - "b": 410.7366, + "l": 87.64582824707031, + "t": 240.90216064453125, + "r": 334.5821228027344, + "b": 722.9614028930664, "coord_origin": "TOPLEFT" }, - "confidence": 0.6652874946594238, + "confidence": 0.9790208339691162, "cells": [ { "index": 0, @@ -1557,43 +2642,22 @@ "a": 255 }, "rect": { - "r_x0": 72.850723, - "r_y0": 410.7366, - "r_x1": 101.89737999999998, - "r_y1": 410.7366, - "r_x2": 101.89737999999998, - "r_y2": 194.03978999999998, - "r_x3": 72.850723, - "r_y3": 194.03978999999998, + "r_x0": 126.33333333333334, + "r_y0": 694.6666666666666, + "r_x1": 126.33333333333334, + "r_y1": 602.0, + "r_x2": 105.66666666666666, + "r_y2": 602.0, + "r_x3": 105.66666666666666, + "r_y3": 694.6666666666666, "coord_origin": "TOPLEFT" }, - "text": "This is a table test ", - "orig": "This is a table test ", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - } - ], - "children": [] - }, - "text": "This is a table test" - }, - { - "label": "text", - "id": 7, - "page_no": 0, - "cluster": { - "id": 7, - "label": "text", - "bbox": { - "l": 124.28839, - "t": 235.72681, - "r": 136.57715, - "b": 540.000015, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.8457421064376831, - "cells": [ + "confidence": 90.0, + "from_ocr": true + }, { "index": 1, "rgba": { @@ -1603,43 +2667,22 @@ "a": 255 }, "rect": { - "r_x0": 124.28839, - "r_y0": 540.000015, - "r_x1": 136.57715, - "r_y1": 540.000015, - "r_x2": 136.57715, - "r_y2": 235.72681, - "r_x3": 124.28839, - "r_y3": 235.72681, + "r_x0": 157.66666666666669, + "r_y0": 680.3333333333334, + "r_x1": 157.66666666666669, + "r_y1": 610.0, + "r_x2": 137.0, + "r_y2": 610.0, + "r_x3": 137.0, + "r_y3": 680.3333333333334, "coord_origin": "TOPLEFT" }, - "text": "Theteststartswithsomerandomtextandthenatableimage: ", - "orig": "Theteststartswithsomerandomtextandthenatableimage: ", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - } - ], - "children": [] - }, - "text": "Theteststartswithsomerandomtextandthenatableimage:" - }, - { - "label": "form", - "id": 8, - "page_no": 0, - "cluster": { - "id": 8, - "label": "form", - "bbox": { - "l": 182.33333333333334, - "t": 133.0, - "r": 283.66666666666663, - "b": 451.6666666666667, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.7344542741775513, - "cells": [ + "confidence": 92.0, + "from_ocr": true + }, { "index": 2, "rgba": { @@ -1649,20 +2692,20 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 337.0, - "r_x1": 191.0, - "r_y1": 308.0, - "r_x2": 182.33333333333334, - "r_y2": 308.0, - "r_x3": 182.33333333333334, - "r_y3": 337.0, + "r_x0": 220.0, + "r_y0": 670.3333333333334, + "r_x1": 220.0, + "r_y1": 623.3333333333334, + "r_x2": 204.0, + "r_y2": 623.3333333333334, + "r_x3": 204.0, + "r_y3": 670.3333333333334, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9576889799999999, + "confidence": 96.0, "from_ocr": true }, { @@ -1674,20 +2717,20 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 304.0, - "r_x1": 191.0, - "r_y1": 268.33333333333337, - "r_x2": 182.33333333333334, - "r_y2": 268.33333333333337, - "r_x3": 182.33333333333334, - "r_y3": 304.0, + "r_x0": 300.0, + "r_y0": 670.3333333333334, + "r_x1": 300.0, + "r_y1": 623.3333333333334, + "r_x2": 284.0, + "r_y2": 623.3333333333334, + "r_x3": 284.0, + "r_y3": 670.3333333333334, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9576889799999999, + "confidence": 96.0, "from_ocr": true }, { @@ -1699,20 +2742,20 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 230.66666666666666, - "r_x1": 191.0, - "r_y1": 201.66666666666669, - "r_x2": 182.33333333333334, - "r_y2": 201.66666666666669, - "r_x3": 182.33333333333334, - "r_y3": 230.66666666666666, + "r_x0": 126.33333333333334, + "r_y0": 559.6666666666667, + "r_x1": 126.33333333333334, + "r_y1": 428.0, + "r_x2": 105.66666666666666, + "r_y2": 428.0, + "r_x3": 105.66666666666666, + "r_y3": 559.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 0.9617948900000001, + "confidence": 91.0, "from_ocr": true }, { @@ -1724,20 +2767,20 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 197.66666666666669, - "r_x1": 191.0, - "r_y1": 172.0, - "r_x2": 182.33333333333334, - "r_y2": 172.0, - "r_x3": 182.33333333333334, - "r_y3": 197.66666666666669, + "r_x0": 153.0, + "r_y0": 526.6666666666667, + "r_x1": 153.0, + "r_y1": 456.0, + "r_x2": 137.0, + "r_y2": 456.0, + "r_x3": 137.0, + "r_y3": 526.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.96105423, + "confidence": 95.0, "from_ocr": true }, { @@ -1749,20 +2792,20 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 168.66666666666669, - "r_x1": 191.0, - "r_y1": 133.0, - "r_x2": 182.33333333333334, - "r_y2": 133.0, - "r_x3": 182.33333333333334, - "r_y3": 168.66666666666669, + "r_x0": 204.33333333333334, + "r_y0": 545.0, + "r_x1": 204.33333333333334, + "r_y1": 442.3333333333333, + "r_x2": 188.33333333333331, + "r_y2": 442.3333333333333, + "r_x3": 188.33333333333331, + "r_y3": 545.0, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.95868614, + "confidence": 95.0, "from_ocr": true }, { @@ -1774,20 +2817,20 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 437.3333333333333, - "r_x1": 237.33333333333331, - "r_y1": 408.3333333333333, - "r_x2": 228.66666666666669, - "r_y2": 408.3333333333333, - "r_x3": 228.66666666666669, - "r_y3": 437.3333333333333, + "r_x0": 236.0, + "r_y0": 515.0, + "r_x1": 236.0, + "r_y1": 468.0, + "r_x2": 220.0, + "r_y2": 468.0, + "r_x3": 220.0, + "r_y3": 515.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9579908, + "confidence": 96.0, "from_ocr": true }, { @@ -1799,20 +2842,20 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 404.0, - "r_x1": 237.33333333333331, - "r_y1": 386.3333333333333, - "r_x2": 231.0, - "r_y2": 386.3333333333333, - "r_x3": 231.0, - "r_y3": 404.0, + "r_x0": 284.0, + "r_y0": 545.0, + "r_x1": 284.0, + "r_y1": 442.3333333333333, + "r_x2": 268.0, + "r_y2": 442.3333333333333, + "r_x3": 268.0, + "r_y3": 545.0, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.96640068, + "confidence": 93.0, "from_ocr": true }, { @@ -1824,20 +2867,20 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 326.33333333333337, - "r_x1": 237.33333333333331, - "r_y1": 299.0, - "r_x2": 231.0, - "r_y2": 299.0, - "r_x3": 231.0, - "r_y3": 326.33333333333337, + "r_x0": 315.33333333333337, + "r_y0": 515.0, + "r_x1": 315.33333333333337, + "r_y1": 468.0, + "r_x2": 299.66666666666663, + "r_y2": 468.0, + "r_x3": 299.66666666666663, + "r_y3": 515.0, "coord_origin": "TOPLEFT" }, - "text": "some", - "orig": "some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96376541, + "confidence": 96.0, "from_ocr": true }, { @@ -1849,20 +2892,20 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 295.33333333333337, - "r_x1": 237.33333333333331, - "r_y1": 279.0, - "r_x2": 228.66666666666669, - "r_y2": 279.0, - "r_x3": 228.66666666666669, - "r_y3": 295.33333333333337, + "r_x0": 121.66666666666666, + "r_y0": 385.6666666666667, + "r_x1": 121.66666666666666, + "r_y1": 274.0, + "r_x2": 105.66666666666666, + "r_y2": 274.0, + "r_x3": 105.66666666666666, + "r_y3": 385.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "cell", - "orig": "cell", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.95824509, + "confidence": 95.0, "from_ocr": true }, { @@ -1874,20 +2917,20 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 213.66666666666666, - "r_x1": 237.33333333333331, - "r_y1": 190.0, - "r_x2": 228.66666666666669, - "r_y2": 190.0, - "r_x3": 228.66666666666669, - "r_y3": 213.66666666666666, + "r_x0": 153.0, + "r_y0": 363.0, + "r_x1": 153.0, + "r_y1": 292.66666666666663, + "r_x2": 137.0, + "r_y2": 292.66666666666663, + "r_x3": 137.0, + "r_y3": 363.0, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9643471499999999, + "confidence": 94.0, "from_ocr": true }, { @@ -1899,20 +2942,20 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 186.0, - "r_x1": 237.33333333333331, - "r_y1": 149.0, - "r_x2": 229.0, - "r_y2": 149.0, - "r_x3": 229.0, - "r_y3": 186.0, + "r_x0": 204.33333333333334, + "r_y0": 384.0, + "r_x1": 204.33333333333334, + "r_y1": 278.0, + "r_x2": 188.33333333333331, + "r_y2": 278.0, + "r_x3": 188.33333333333331, + "r_y3": 384.0, "coord_origin": "TOPLEFT" }, - "text": "content", - "orig": "content", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.96289528, + "confidence": 95.0, "from_ocr": true }, { @@ -1924,20 +2967,20 @@ "a": 255 }, "rect": { - "r_x0": 283.66666666666663, - "r_y0": 451.6666666666667, - "r_x1": 283.66666666666663, - "r_y1": 422.6666666666667, - "r_x2": 275.0, - "r_y2": 422.6666666666667, - "r_x3": 275.0, - "r_y3": 451.6666666666667, + "r_x0": 236.0, + "r_y0": 351.33333333333337, + "r_x1": 236.0, + "r_y1": 304.33333333333337, + "r_x2": 220.0, + "r_y2": 304.33333333333337, + "r_x3": 220.0, + "r_y3": 351.33333333333337, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9611363199999999, + "confidence": 95.0, "from_ocr": true }, { @@ -1949,20 +2992,20 @@ "a": 255 }, "rect": { - "r_x0": 283.66666666666663, - "r_y0": 419.0, - "r_x1": 283.66666666666663, - "r_y1": 393.0, - "r_x2": 275.0, - "r_y2": 393.0, - "r_x3": 275.0, - "r_y3": 419.0, + "r_x0": 284.0, + "r_y0": 383.6666666666667, + "r_x1": 284.0, + "r_y1": 278.0, + "r_x2": 268.0, + "r_y2": 278.0, + "r_x3": 268.0, + "r_y3": 383.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.9588653600000001, + "confidence": 95.0, "from_ocr": true }, { @@ -1974,85 +3017,115 @@ "a": 255 }, "rect": { - "r_x0": 283.66666666666663, - "r_y0": 389.3333333333333, - "r_x1": 283.66666666666663, - "r_y1": 371.6666666666667, - "r_x2": 277.33333333333337, - "r_y2": 371.6666666666667, - "r_x3": 277.33333333333337, - "r_y3": 389.3333333333333, + "r_x0": 315.33333333333337, + "r_y0": 351.33333333333337, + "r_x1": 315.33333333333337, + "r_y1": 304.33333333333337, + "r_x2": 299.66666666666663, + "r_y2": 304.33333333333337, + "r_x3": 299.66666666666663, + "r_y3": 351.33333333333337, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.95681549, - "from_ocr": true - }, - { - "index": 16, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 283.66666666666663, - "r_y0": 329.0, - "r_x1": 283.66666666666663, - "r_y1": 303.0, - "r_x2": 275.0, - "r_y2": 303.0, - "r_x3": 275.0, - "r_y3": 329.0, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.9589106, - "from_ocr": true - }, - { - "index": 17, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 283.66666666666663, - "r_y0": 299.66666666666663, - "r_x1": 283.66666666666663, - "r_y1": 275.66666666666663, - "r_x2": 275.0, - "r_y2": 275.66666666666663, - "r_x3": 275.0, - "r_y3": 299.66666666666663, - "coord_origin": "TOPLEFT" - }, - "text": "don't", - "orig": "don't", - "text_direction": "left_to_right", - "confidence": 0.96121948, + "confidence": 95.0, "from_ocr": true } ], "children": [ { - "id": 4, + "id": 1, "label": "text", "bbox": { - "l": 182.33333333333334, - "t": 268.33333333333337, - "r": 191.0, - "b": 337.0, + "l": 105.66666666666666, + "t": 602.0, + "r": 126.33333333333334, + "b": 694.6666666666666, "coord_origin": "TOPLEFT" }, - "confidence": 0.9089116454124451, + "confidence": 90.0, + "cells": [ + { + "index": 0, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 126.33333333333334, + "r_y0": 694.6666666666666, + "r_x1": 126.33333333333334, + "r_y1": 602.0, + "r_x2": 105.66666666666666, + "r_y2": 602.0, + "r_x3": 105.66666666666666, + "r_y3": 694.6666666666666, + "coord_origin": "TOPLEFT" + }, + "text": "Vertically", + "orig": "Vertically", + "text_direction": "left_to_right", + "confidence": 90.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 2, + "label": "text", + "bbox": { + "l": 137.0, + "t": 610.0, + "r": 157.66666666666669, + "b": 680.3333333333334, + "coord_origin": "TOPLEFT" + }, + "confidence": 92.0, + "cells": [ + { + "index": 1, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 157.66666666666669, + "r_y0": 680.3333333333334, + "r_x1": 157.66666666666669, + "r_y1": 610.0, + "r_x2": 137.0, + "r_y2": 610.0, + "r_x3": 137.0, + "r_y3": 680.3333333333334, + "coord_origin": "TOPLEFT" + }, + "text": "merged", + "orig": "merged", + "text_direction": "left_to_right", + "confidence": 92.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 3, + "label": "text", + "bbox": { + "l": 204.0, + "t": 623.3333333333334, + "r": 220.0, + "b": 670.3333333333334, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, "cells": [ { "index": 2, @@ -2063,22 +3136,37 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 337.0, - "r_x1": 191.0, - "r_y1": 308.0, - "r_x2": 182.33333333333334, - "r_y2": 308.0, - "r_x3": 182.33333333333334, - "r_y3": 337.0, + "r_x0": 220.0, + "r_y0": 670.3333333333334, + "r_x1": 220.0, + "r_y1": 623.3333333333334, + "r_x2": 204.0, + "r_y2": 623.3333333333334, + "r_x3": 204.0, + "r_y3": 670.3333333333334, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9576889799999999, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 4, + "label": "text", + "bbox": { + "l": 284.0, + "t": 623.3333333333334, + "r": 300.0, + "b": 670.3333333333334, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ { "index": 3, "rgba": { @@ -2088,20 +3176,20 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 304.0, - "r_x1": 191.0, - "r_y1": 268.33333333333337, - "r_x2": 182.33333333333334, - "r_y2": 268.33333333333337, - "r_x3": 182.33333333333334, - "r_y3": 304.0, + "r_x0": 300.0, + "r_y0": 670.3333333333334, + "r_x1": 300.0, + "r_y1": 623.3333333333334, + "r_x2": 284.0, + "r_y2": 623.3333333333334, + "r_x3": 284.0, + "r_y3": 670.3333333333334, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9576889799999999, + "confidence": 96.0, "from_ocr": true } ], @@ -2111,13 +3199,13 @@ "id": 5, "label": "text", "bbox": { - "l": 182.33333333333334, - "t": 133.0, - "r": 191.0, - "b": 230.66666666666666, + "l": 105.66666666666666, + "t": 428.0, + "r": 126.33333333333334, + "b": 559.6666666666667, "coord_origin": "TOPLEFT" }, - "confidence": 0.9040389060974121, + "confidence": 91.0, "cells": [ { "index": 4, @@ -2128,22 +3216,37 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 230.66666666666666, - "r_x1": 191.0, - "r_y1": 201.66666666666669, - "r_x2": 182.33333333333334, - "r_y2": 201.66666666666669, - "r_x3": 182.33333333333334, - "r_y3": 230.66666666666666, + "r_x0": 126.33333333333334, + "r_y0": 559.6666666666667, + "r_x1": 126.33333333333334, + "r_y1": 428.0, + "r_x2": 105.66666666666666, + "r_y2": 428.0, + "r_x3": 105.66666666666666, + "r_y3": 559.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 0.9617948900000001, + "confidence": 91.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 6, + "label": "text", + "bbox": { + "l": 137.0, + "t": 456.0, + "r": 153.0, + "b": 526.6666666666667, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 5, "rgba": { @@ -2153,22 +3256,37 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 197.66666666666669, - "r_x1": 191.0, - "r_y1": 172.0, - "r_x2": 182.33333333333334, - "r_y2": 172.0, - "r_x3": 182.33333333333334, - "r_y3": 197.66666666666669, + "r_x0": 153.0, + "r_y0": 526.6666666666667, + "r_x1": 153.0, + "r_y1": 456.0, + "r_x2": 137.0, + "r_y2": 456.0, + "r_x3": 137.0, + "r_y3": 526.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.96105423, + "confidence": 95.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 7, + "label": "text", + "bbox": { + "l": 188.33333333333331, + "t": 442.3333333333333, + "r": 204.33333333333334, + "b": 545.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 6, "rgba": { @@ -2178,36 +3296,36 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 168.66666666666669, - "r_x1": 191.0, - "r_y1": 133.0, - "r_x2": 182.33333333333334, - "r_y2": 133.0, - "r_x3": 182.33333333333334, - "r_y3": 168.66666666666669, + "r_x0": 204.33333333333334, + "r_y0": 545.0, + "r_x1": 204.33333333333334, + "r_y1": 442.3333333333333, + "r_x2": 188.33333333333331, + "r_y2": 442.3333333333333, + "r_x3": 188.33333333333331, + "r_y3": 545.0, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.95868614, + "confidence": 95.0, "from_ocr": true } ], "children": [] }, { - "id": 0, + "id": 8, "label": "text", "bbox": { - "l": 228.66666666666669, - "t": 386.3333333333333, - "r": 237.33333333333331, - "b": 437.3333333333333, + "l": 220.0, + "t": 468.0, + "r": 236.0, + "b": 515.0, "coord_origin": "TOPLEFT" }, - "confidence": 0.9155756235122681, + "confidence": 96.0, "cells": [ { "index": 7, @@ -2218,22 +3336,37 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 437.3333333333333, - "r_x1": 237.33333333333331, - "r_y1": 408.3333333333333, - "r_x2": 228.66666666666669, - "r_y2": 408.3333333333333, - "r_x3": 228.66666666666669, - "r_y3": 437.3333333333333, + "r_x0": 236.0, + "r_y0": 515.0, + "r_x1": 236.0, + "r_y1": 468.0, + "r_x2": 220.0, + "r_y2": 468.0, + "r_x3": 220.0, + "r_y3": 515.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9579908, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 9, + "label": "text", + "bbox": { + "l": 268.0, + "t": 442.3333333333333, + "r": 284.0, + "b": 545.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 93.0, + "cells": [ { "index": 8, "rgba": { @@ -2243,36 +3376,36 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 404.0, - "r_x1": 237.33333333333331, - "r_y1": 386.3333333333333, - "r_x2": 231.0, - "r_y2": 386.3333333333333, - "r_x3": 231.0, - "r_y3": 404.0, + "r_x0": 284.0, + "r_y0": 545.0, + "r_x1": 284.0, + "r_y1": 442.3333333333333, + "r_x2": 268.0, + "r_y2": 442.3333333333333, + "r_x3": 268.0, + "r_y3": 545.0, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.96640068, + "confidence": 93.0, "from_ocr": true } ], "children": [] }, { - "id": 2, + "id": 10, "label": "text", "bbox": { - "l": 228.66666666666669, - "t": 279.0, - "r": 237.33333333333331, - "b": 326.33333333333337, + "l": 299.66666666666663, + "t": 468.0, + "r": 315.33333333333337, + "b": 515.0, "coord_origin": "TOPLEFT" }, - "confidence": 0.9143174290657043, + "confidence": 96.0, "cells": [ { "index": 9, @@ -2283,22 +3416,37 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 326.33333333333337, - "r_x1": 237.33333333333331, - "r_y1": 299.0, - "r_x2": 231.0, - "r_y2": 299.0, - "r_x3": 231.0, - "r_y3": 326.33333333333337, + "r_x0": 315.33333333333337, + "r_y0": 515.0, + "r_x1": 315.33333333333337, + "r_y1": 468.0, + "r_x2": 299.66666666666663, + "r_y2": 468.0, + "r_x3": 299.66666666666663, + "r_y3": 515.0, "coord_origin": "TOPLEFT" }, - "text": "some", - "orig": "some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96376541, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 11, + "label": "text", + "bbox": { + "l": 105.66666666666666, + "t": 274.0, + "r": 121.66666666666666, + "b": 385.6666666666667, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 10, "rgba": { @@ -2308,36 +3456,36 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 295.33333333333337, - "r_x1": 237.33333333333331, - "r_y1": 279.0, - "r_x2": 228.66666666666669, - "r_y2": 279.0, - "r_x3": 228.66666666666669, - "r_y3": 295.33333333333337, + "r_x0": 121.66666666666666, + "r_y0": 385.6666666666667, + "r_x1": 121.66666666666666, + "r_y1": 274.0, + "r_x2": 105.66666666666666, + "r_y2": 274.0, + "r_x3": 105.66666666666666, + "r_y3": 385.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "cell", - "orig": "cell", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.95824509, + "confidence": 95.0, "from_ocr": true } ], "children": [] }, { - "id": 6, + "id": 12, "label": "text", "bbox": { - "l": 228.66666666666669, - "t": 149.0, - "r": 237.33333333333331, - "b": 213.66666666666666, + "l": 137.0, + "t": 292.66666666666663, + "r": 153.0, + "b": 363.0, "coord_origin": "TOPLEFT" }, - "confidence": 0.9003775715827942, + "confidence": 94.0, "cells": [ { "index": 11, @@ -2348,22 +3496,37 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 213.66666666666666, - "r_x1": 237.33333333333331, - "r_y1": 190.0, - "r_x2": 228.66666666666669, - "r_y2": 190.0, - "r_x3": 228.66666666666669, - "r_y3": 213.66666666666666, + "r_x0": 153.0, + "r_y0": 363.0, + "r_x1": 153.0, + "r_y1": 292.66666666666663, + "r_x2": 137.0, + "r_y2": 292.66666666666663, + "r_x3": 137.0, + "r_y3": 363.0, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9643471499999999, + "confidence": 94.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 13, + "label": "text", + "bbox": { + "l": 188.33333333333331, + "t": 278.0, + "r": 204.33333333333334, + "b": 384.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 12, "rgba": { @@ -2373,36 +3536,36 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 186.0, - "r_x1": 237.33333333333331, - "r_y1": 149.0, - "r_x2": 229.0, - "r_y2": 149.0, - "r_x3": 229.0, - "r_y3": 186.0, + "r_x0": 204.33333333333334, + "r_y0": 384.0, + "r_x1": 204.33333333333334, + "r_y1": 278.0, + "r_x2": 188.33333333333331, + "r_y2": 278.0, + "r_x3": 188.33333333333331, + "r_y3": 384.0, "coord_origin": "TOPLEFT" }, - "text": "content", - "orig": "content", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.96289528, + "confidence": 95.0, "from_ocr": true } ], "children": [] }, { - "id": 1, + "id": 14, "label": "text", "bbox": { - "l": 275.0, - "t": 371.6666666666667, - "r": 283.66666666666663, - "b": 451.6666666666667, + "l": 220.0, + "t": 304.33333333333337, + "r": 236.0, + "b": 351.33333333333337, "coord_origin": "TOPLEFT" }, - "confidence": 0.9147250652313232, + "confidence": 95.0, "cells": [ { "index": 13, @@ -2413,22 +3576,37 @@ "a": 255 }, "rect": { - "r_x0": 283.66666666666663, - "r_y0": 451.6666666666667, - "r_x1": 283.66666666666663, - "r_y1": 422.6666666666667, - "r_x2": 275.0, - "r_y2": 422.6666666666667, - "r_x3": 275.0, - "r_y3": 451.6666666666667, + "r_x0": 236.0, + "r_y0": 351.33333333333337, + "r_x1": 236.0, + "r_y1": 304.33333333333337, + "r_x2": 220.0, + "r_y2": 304.33333333333337, + "r_x3": 220.0, + "r_y3": 351.33333333333337, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9611363199999999, + "confidence": 95.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 15, + "label": "text", + "bbox": { + "l": 268.0, + "t": 278.0, + "r": 284.0, + "b": 383.6666666666667, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 14, "rgba": { @@ -2438,22 +3616,37 @@ "a": 255 }, "rect": { - "r_x0": 283.66666666666663, - "r_y0": 419.0, - "r_x1": 283.66666666666663, - "r_y1": 393.0, - "r_x2": 275.0, - "r_y2": 393.0, - "r_x3": 275.0, - "r_y3": 419.0, + "r_x0": 284.0, + "r_y0": 383.6666666666667, + "r_x1": 284.0, + "r_y1": 278.0, + "r_x2": 268.0, + "r_y2": 278.0, + "r_x3": 268.0, + "r_y3": 383.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.9588653600000001, + "confidence": 95.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 16, + "label": "text", + "bbox": { + "l": 299.66666666666663, + "t": 304.33333333333337, + "r": 315.33333333333337, + "b": 351.33333333333337, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 15, "rgba": { @@ -2463,85 +3656,20 @@ "a": 255 }, "rect": { - "r_x0": 283.66666666666663, - "r_y0": 389.3333333333333, - "r_x1": 283.66666666666663, - "r_y1": 371.6666666666667, - "r_x2": 277.33333333333337, - "r_y2": 371.6666666666667, - "r_x3": 277.33333333333337, - "r_y3": 389.3333333333333, + "r_x0": 315.33333333333337, + "r_y0": 351.33333333333337, + "r_x1": 315.33333333333337, + "r_y1": 304.33333333333337, + "r_x2": 299.66666666666663, + "r_y2": 304.33333333333337, + "r_x3": 299.66666666666663, + "r_y3": 351.33333333333337, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.95681549, - "from_ocr": true - } - ], - "children": [] - }, - { - "id": 3, - "label": "text", - "bbox": { - "l": 275.0, - "t": 275.66666666666663, - "r": 283.66666666666663, - "b": 329.0, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.9124712347984314, - "cells": [ - { - "index": 16, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 283.66666666666663, - "r_y0": 329.0, - "r_x1": 283.66666666666663, - "r_y1": 303.0, - "r_x2": 275.0, - "r_y2": 303.0, - "r_x3": 275.0, - "r_y3": 329.0, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.9589106, - "from_ocr": true - }, - { - "index": 17, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 283.66666666666663, - "r_y0": 299.66666666666663, - "r_x1": 283.66666666666663, - "r_y1": 275.66666666666663, - "r_x2": 275.0, - "r_y2": 275.66666666666663, - "r_x3": 275.0, - "r_y3": 299.66666666666663, - "coord_origin": "TOPLEFT" - }, - "text": "don't", - "orig": "don't", - "text_direction": "left_to_right", - "confidence": 0.96121948, + "confidence": 95.0, "from_ocr": true } ], @@ -2549,25 +3677,42 @@ } ] }, - "text": null + "text": null, + "otsl_seq": [ + "ched", + "ched", + "ched", + "nl", + "fcel", + "fcel", + "fcel", + "nl", + "fcel", + "fcel", + "fcel", + "nl" + ], + "num_rows": 0, + "num_cols": 0, + "table_cells": [] } ], "body": [ { - "label": "section_header", - "id": 9, + "label": "table", + "id": 0, "page_no": 0, "cluster": { - "id": 9, - "label": "section_header", + "id": 0, + "label": "table", "bbox": { - "l": 72.850723, - "t": 194.03978999999998, - "r": 101.89737999999998, - "b": 410.7366, + "l": 87.64582824707031, + "t": 240.90216064453125, + "r": 334.5821228027344, + "b": 722.9614028930664, "coord_origin": "TOPLEFT" }, - "confidence": 0.6652874946594238, + "confidence": 0.9790208339691162, "cells": [ { "index": 0, @@ -2578,43 +3723,22 @@ "a": 255 }, "rect": { - "r_x0": 72.850723, - "r_y0": 410.7366, - "r_x1": 101.89737999999998, - "r_y1": 410.7366, - "r_x2": 101.89737999999998, - "r_y2": 194.03978999999998, - "r_x3": 72.850723, - "r_y3": 194.03978999999998, + "r_x0": 126.33333333333334, + "r_y0": 694.6666666666666, + "r_x1": 126.33333333333334, + "r_y1": 602.0, + "r_x2": 105.66666666666666, + "r_y2": 602.0, + "r_x3": 105.66666666666666, + "r_y3": 694.6666666666666, "coord_origin": "TOPLEFT" }, - "text": "This is a table test ", - "orig": "This is a table test ", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - } - ], - "children": [] - }, - "text": "This is a table test" - }, - { - "label": "text", - "id": 7, - "page_no": 0, - "cluster": { - "id": 7, - "label": "text", - "bbox": { - "l": 124.28839, - "t": 235.72681, - "r": 136.57715, - "b": 540.000015, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.8457421064376831, - "cells": [ + "confidence": 90.0, + "from_ocr": true + }, { "index": 1, "rgba": { @@ -2624,43 +3748,22 @@ "a": 255 }, "rect": { - "r_x0": 124.28839, - "r_y0": 540.000015, - "r_x1": 136.57715, - "r_y1": 540.000015, - "r_x2": 136.57715, - "r_y2": 235.72681, - "r_x3": 124.28839, - "r_y3": 235.72681, + "r_x0": 157.66666666666669, + "r_y0": 680.3333333333334, + "r_x1": 157.66666666666669, + "r_y1": 610.0, + "r_x2": 137.0, + "r_y2": 610.0, + "r_x3": 137.0, + "r_y3": 680.3333333333334, "coord_origin": "TOPLEFT" }, - "text": "Theteststartswithsomerandomtextandthenatableimage: ", - "orig": "Theteststartswithsomerandomtextandthenatableimage: ", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false - } - ], - "children": [] - }, - "text": "Theteststartswithsomerandomtextandthenatableimage:" - }, - { - "label": "form", - "id": 8, - "page_no": 0, - "cluster": { - "id": 8, - "label": "form", - "bbox": { - "l": 182.33333333333334, - "t": 133.0, - "r": 283.66666666666663, - "b": 451.6666666666667, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.7344542741775513, - "cells": [ + "confidence": 92.0, + "from_ocr": true + }, { "index": 2, "rgba": { @@ -2670,20 +3773,20 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 337.0, - "r_x1": 191.0, - "r_y1": 308.0, - "r_x2": 182.33333333333334, - "r_y2": 308.0, - "r_x3": 182.33333333333334, - "r_y3": 337.0, + "r_x0": 220.0, + "r_y0": 670.3333333333334, + "r_x1": 220.0, + "r_y1": 623.3333333333334, + "r_x2": 204.0, + "r_y2": 623.3333333333334, + "r_x3": 204.0, + "r_y3": 670.3333333333334, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9576889799999999, + "confidence": 96.0, "from_ocr": true }, { @@ -2695,20 +3798,20 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 304.0, - "r_x1": 191.0, - "r_y1": 268.33333333333337, - "r_x2": 182.33333333333334, - "r_y2": 268.33333333333337, - "r_x3": 182.33333333333334, - "r_y3": 304.0, + "r_x0": 300.0, + "r_y0": 670.3333333333334, + "r_x1": 300.0, + "r_y1": 623.3333333333334, + "r_x2": 284.0, + "r_y2": 623.3333333333334, + "r_x3": 284.0, + "r_y3": 670.3333333333334, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9576889799999999, + "confidence": 96.0, "from_ocr": true }, { @@ -2720,20 +3823,20 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 230.66666666666666, - "r_x1": 191.0, - "r_y1": 201.66666666666669, - "r_x2": 182.33333333333334, - "r_y2": 201.66666666666669, - "r_x3": 182.33333333333334, - "r_y3": 230.66666666666666, + "r_x0": 126.33333333333334, + "r_y0": 559.6666666666667, + "r_x1": 126.33333333333334, + "r_y1": 428.0, + "r_x2": 105.66666666666666, + "r_y2": 428.0, + "r_x3": 105.66666666666666, + "r_y3": 559.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 0.9617948900000001, + "confidence": 91.0, "from_ocr": true }, { @@ -2745,20 +3848,20 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 197.66666666666669, - "r_x1": 191.0, - "r_y1": 172.0, - "r_x2": 182.33333333333334, - "r_y2": 172.0, - "r_x3": 182.33333333333334, - "r_y3": 197.66666666666669, + "r_x0": 153.0, + "r_y0": 526.6666666666667, + "r_x1": 153.0, + "r_y1": 456.0, + "r_x2": 137.0, + "r_y2": 456.0, + "r_x3": 137.0, + "r_y3": 526.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.96105423, + "confidence": 95.0, "from_ocr": true }, { @@ -2770,20 +3873,20 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 168.66666666666669, - "r_x1": 191.0, - "r_y1": 133.0, - "r_x2": 182.33333333333334, - "r_y2": 133.0, - "r_x3": 182.33333333333334, - "r_y3": 168.66666666666669, + "r_x0": 204.33333333333334, + "r_y0": 545.0, + "r_x1": 204.33333333333334, + "r_y1": 442.3333333333333, + "r_x2": 188.33333333333331, + "r_y2": 442.3333333333333, + "r_x3": 188.33333333333331, + "r_y3": 545.0, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.95868614, + "confidence": 95.0, "from_ocr": true }, { @@ -2795,20 +3898,20 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 437.3333333333333, - "r_x1": 237.33333333333331, - "r_y1": 408.3333333333333, - "r_x2": 228.66666666666669, - "r_y2": 408.3333333333333, - "r_x3": 228.66666666666669, - "r_y3": 437.3333333333333, + "r_x0": 236.0, + "r_y0": 515.0, + "r_x1": 236.0, + "r_y1": 468.0, + "r_x2": 220.0, + "r_y2": 468.0, + "r_x3": 220.0, + "r_y3": 515.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9579908, + "confidence": 96.0, "from_ocr": true }, { @@ -2820,20 +3923,20 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 404.0, - "r_x1": 237.33333333333331, - "r_y1": 386.3333333333333, - "r_x2": 231.0, - "r_y2": 386.3333333333333, - "r_x3": 231.0, - "r_y3": 404.0, + "r_x0": 284.0, + "r_y0": 545.0, + "r_x1": 284.0, + "r_y1": 442.3333333333333, + "r_x2": 268.0, + "r_y2": 442.3333333333333, + "r_x3": 268.0, + "r_y3": 545.0, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.96640068, + "confidence": 93.0, "from_ocr": true }, { @@ -2845,20 +3948,20 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 326.33333333333337, - "r_x1": 237.33333333333331, - "r_y1": 299.0, - "r_x2": 231.0, - "r_y2": 299.0, - "r_x3": 231.0, - "r_y3": 326.33333333333337, + "r_x0": 315.33333333333337, + "r_y0": 515.0, + "r_x1": 315.33333333333337, + "r_y1": 468.0, + "r_x2": 299.66666666666663, + "r_y2": 468.0, + "r_x3": 299.66666666666663, + "r_y3": 515.0, "coord_origin": "TOPLEFT" }, - "text": "some", - "orig": "some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96376541, + "confidence": 96.0, "from_ocr": true }, { @@ -2870,20 +3973,20 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 295.33333333333337, - "r_x1": 237.33333333333331, - "r_y1": 279.0, - "r_x2": 228.66666666666669, - "r_y2": 279.0, - "r_x3": 228.66666666666669, - "r_y3": 295.33333333333337, + "r_x0": 121.66666666666666, + "r_y0": 385.6666666666667, + "r_x1": 121.66666666666666, + "r_y1": 274.0, + "r_x2": 105.66666666666666, + "r_y2": 274.0, + "r_x3": 105.66666666666666, + "r_y3": 385.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "cell", - "orig": "cell", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.95824509, + "confidence": 95.0, "from_ocr": true }, { @@ -2895,20 +3998,20 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 213.66666666666666, - "r_x1": 237.33333333333331, - "r_y1": 190.0, - "r_x2": 228.66666666666669, - "r_y2": 190.0, - "r_x3": 228.66666666666669, - "r_y3": 213.66666666666666, + "r_x0": 153.0, + "r_y0": 363.0, + "r_x1": 153.0, + "r_y1": 292.66666666666663, + "r_x2": 137.0, + "r_y2": 292.66666666666663, + "r_x3": 137.0, + "r_y3": 363.0, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9643471499999999, + "confidence": 94.0, "from_ocr": true }, { @@ -2920,20 +4023,20 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 186.0, - "r_x1": 237.33333333333331, - "r_y1": 149.0, - "r_x2": 229.0, - "r_y2": 149.0, - "r_x3": 229.0, - "r_y3": 186.0, + "r_x0": 204.33333333333334, + "r_y0": 384.0, + "r_x1": 204.33333333333334, + "r_y1": 278.0, + "r_x2": 188.33333333333331, + "r_y2": 278.0, + "r_x3": 188.33333333333331, + "r_y3": 384.0, "coord_origin": "TOPLEFT" }, - "text": "content", - "orig": "content", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.96289528, + "confidence": 95.0, "from_ocr": true }, { @@ -2945,20 +4048,20 @@ "a": 255 }, "rect": { - "r_x0": 283.66666666666663, - "r_y0": 451.6666666666667, - "r_x1": 283.66666666666663, - "r_y1": 422.6666666666667, - "r_x2": 275.0, - "r_y2": 422.6666666666667, - "r_x3": 275.0, - "r_y3": 451.6666666666667, + "r_x0": 236.0, + "r_y0": 351.33333333333337, + "r_x1": 236.0, + "r_y1": 304.33333333333337, + "r_x2": 220.0, + "r_y2": 304.33333333333337, + "r_x3": 220.0, + "r_y3": 351.33333333333337, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9611363199999999, + "confidence": 95.0, "from_ocr": true }, { @@ -2970,20 +4073,20 @@ "a": 255 }, "rect": { - "r_x0": 283.66666666666663, - "r_y0": 419.0, - "r_x1": 283.66666666666663, - "r_y1": 393.0, - "r_x2": 275.0, - "r_y2": 393.0, - "r_x3": 275.0, - "r_y3": 419.0, + "r_x0": 284.0, + "r_y0": 383.6666666666667, + "r_x1": 284.0, + "r_y1": 278.0, + "r_x2": 268.0, + "r_y2": 278.0, + "r_x3": 268.0, + "r_y3": 383.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.9588653600000001, + "confidence": 95.0, "from_ocr": true }, { @@ -2995,85 +4098,115 @@ "a": 255 }, "rect": { - "r_x0": 283.66666666666663, - "r_y0": 389.3333333333333, - "r_x1": 283.66666666666663, - "r_y1": 371.6666666666667, - "r_x2": 277.33333333333337, - "r_y2": 371.6666666666667, - "r_x3": 277.33333333333337, - "r_y3": 389.3333333333333, + "r_x0": 315.33333333333337, + "r_y0": 351.33333333333337, + "r_x1": 315.33333333333337, + "r_y1": 304.33333333333337, + "r_x2": 299.66666666666663, + "r_y2": 304.33333333333337, + "r_x3": 299.66666666666663, + "r_y3": 351.33333333333337, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.95681549, - "from_ocr": true - }, - { - "index": 16, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 283.66666666666663, - "r_y0": 329.0, - "r_x1": 283.66666666666663, - "r_y1": 303.0, - "r_x2": 275.0, - "r_y2": 303.0, - "r_x3": 275.0, - "r_y3": 329.0, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.9589106, - "from_ocr": true - }, - { - "index": 17, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 283.66666666666663, - "r_y0": 299.66666666666663, - "r_x1": 283.66666666666663, - "r_y1": 275.66666666666663, - "r_x2": 275.0, - "r_y2": 275.66666666666663, - "r_x3": 275.0, - "r_y3": 299.66666666666663, - "coord_origin": "TOPLEFT" - }, - "text": "don't", - "orig": "don't", - "text_direction": "left_to_right", - "confidence": 0.96121948, + "confidence": 95.0, "from_ocr": true } ], "children": [ { - "id": 4, + "id": 1, "label": "text", "bbox": { - "l": 182.33333333333334, - "t": 268.33333333333337, - "r": 191.0, - "b": 337.0, + "l": 105.66666666666666, + "t": 602.0, + "r": 126.33333333333334, + "b": 694.6666666666666, "coord_origin": "TOPLEFT" }, - "confidence": 0.9089116454124451, + "confidence": 90.0, + "cells": [ + { + "index": 0, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 126.33333333333334, + "r_y0": 694.6666666666666, + "r_x1": 126.33333333333334, + "r_y1": 602.0, + "r_x2": 105.66666666666666, + "r_y2": 602.0, + "r_x3": 105.66666666666666, + "r_y3": 694.6666666666666, + "coord_origin": "TOPLEFT" + }, + "text": "Vertically", + "orig": "Vertically", + "text_direction": "left_to_right", + "confidence": 90.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 2, + "label": "text", + "bbox": { + "l": 137.0, + "t": 610.0, + "r": 157.66666666666669, + "b": 680.3333333333334, + "coord_origin": "TOPLEFT" + }, + "confidence": 92.0, + "cells": [ + { + "index": 1, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 157.66666666666669, + "r_y0": 680.3333333333334, + "r_x1": 157.66666666666669, + "r_y1": 610.0, + "r_x2": 137.0, + "r_y2": 610.0, + "r_x3": 137.0, + "r_y3": 680.3333333333334, + "coord_origin": "TOPLEFT" + }, + "text": "merged", + "orig": "merged", + "text_direction": "left_to_right", + "confidence": 92.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 3, + "label": "text", + "bbox": { + "l": 204.0, + "t": 623.3333333333334, + "r": 220.0, + "b": 670.3333333333334, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, "cells": [ { "index": 2, @@ -3084,22 +4217,37 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 337.0, - "r_x1": 191.0, - "r_y1": 308.0, - "r_x2": 182.33333333333334, - "r_y2": 308.0, - "r_x3": 182.33333333333334, - "r_y3": 337.0, + "r_x0": 220.0, + "r_y0": 670.3333333333334, + "r_x1": 220.0, + "r_y1": 623.3333333333334, + "r_x2": 204.0, + "r_y2": 623.3333333333334, + "r_x3": 204.0, + "r_y3": 670.3333333333334, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9576889799999999, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 4, + "label": "text", + "bbox": { + "l": 284.0, + "t": 623.3333333333334, + "r": 300.0, + "b": 670.3333333333334, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ { "index": 3, "rgba": { @@ -3109,20 +4257,20 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 304.0, - "r_x1": 191.0, - "r_y1": 268.33333333333337, - "r_x2": 182.33333333333334, - "r_y2": 268.33333333333337, - "r_x3": 182.33333333333334, - "r_y3": 304.0, + "r_x0": 300.0, + "r_y0": 670.3333333333334, + "r_x1": 300.0, + "r_y1": 623.3333333333334, + "r_x2": 284.0, + "r_y2": 623.3333333333334, + "r_x3": 284.0, + "r_y3": 670.3333333333334, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9576889799999999, + "confidence": 96.0, "from_ocr": true } ], @@ -3132,13 +4280,13 @@ "id": 5, "label": "text", "bbox": { - "l": 182.33333333333334, - "t": 133.0, - "r": 191.0, - "b": 230.66666666666666, + "l": 105.66666666666666, + "t": 428.0, + "r": 126.33333333333334, + "b": 559.6666666666667, "coord_origin": "TOPLEFT" }, - "confidence": 0.9040389060974121, + "confidence": 91.0, "cells": [ { "index": 4, @@ -3149,22 +4297,37 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 230.66666666666666, - "r_x1": 191.0, - "r_y1": 201.66666666666669, - "r_x2": 182.33333333333334, - "r_y2": 201.66666666666669, - "r_x3": 182.33333333333334, - "r_y3": 230.66666666666666, + "r_x0": 126.33333333333334, + "r_y0": 559.6666666666667, + "r_x1": 126.33333333333334, + "r_y1": 428.0, + "r_x2": 105.66666666666666, + "r_y2": 428.0, + "r_x3": 105.66666666666666, + "r_y3": 559.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 0.9617948900000001, + "confidence": 91.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 6, + "label": "text", + "bbox": { + "l": 137.0, + "t": 456.0, + "r": 153.0, + "b": 526.6666666666667, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 5, "rgba": { @@ -3174,22 +4337,37 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 197.66666666666669, - "r_x1": 191.0, - "r_y1": 172.0, - "r_x2": 182.33333333333334, - "r_y2": 172.0, - "r_x3": 182.33333333333334, - "r_y3": 197.66666666666669, + "r_x0": 153.0, + "r_y0": 526.6666666666667, + "r_x1": 153.0, + "r_y1": 456.0, + "r_x2": 137.0, + "r_y2": 456.0, + "r_x3": 137.0, + "r_y3": 526.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.96105423, + "confidence": 95.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 7, + "label": "text", + "bbox": { + "l": 188.33333333333331, + "t": 442.3333333333333, + "r": 204.33333333333334, + "b": 545.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 6, "rgba": { @@ -3199,36 +4377,36 @@ "a": 255 }, "rect": { - "r_x0": 191.0, - "r_y0": 168.66666666666669, - "r_x1": 191.0, - "r_y1": 133.0, - "r_x2": 182.33333333333334, - "r_y2": 133.0, - "r_x3": 182.33333333333334, - "r_y3": 168.66666666666669, + "r_x0": 204.33333333333334, + "r_y0": 545.0, + "r_x1": 204.33333333333334, + "r_y1": 442.3333333333333, + "r_x2": 188.33333333333331, + "r_y2": 442.3333333333333, + "r_x3": 188.33333333333331, + "r_y3": 545.0, "coord_origin": "TOPLEFT" }, - "text": "column", - "orig": "column", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.95868614, + "confidence": 95.0, "from_ocr": true } ], "children": [] }, { - "id": 0, + "id": 8, "label": "text", "bbox": { - "l": 228.66666666666669, - "t": 386.3333333333333, - "r": 237.33333333333331, - "b": 437.3333333333333, + "l": 220.0, + "t": 468.0, + "r": 236.0, + "b": 515.0, "coord_origin": "TOPLEFT" }, - "confidence": 0.9155756235122681, + "confidence": 96.0, "cells": [ { "index": 7, @@ -3239,22 +4417,37 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 437.3333333333333, - "r_x1": 237.33333333333331, - "r_y1": 408.3333333333333, - "r_x2": 228.66666666666669, - "r_y2": 408.3333333333333, - "r_x3": 228.66666666666669, - "r_y3": 437.3333333333333, + "r_x0": 236.0, + "r_y0": 515.0, + "r_x1": 236.0, + "r_y1": 468.0, + "r_x2": 220.0, + "r_y2": 468.0, + "r_x3": 220.0, + "r_y3": 515.0, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9579908, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 9, + "label": "text", + "bbox": { + "l": 268.0, + "t": 442.3333333333333, + "r": 284.0, + "b": 545.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 93.0, + "cells": [ { "index": 8, "rgba": { @@ -3264,36 +4457,36 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 404.0, - "r_x1": 237.33333333333331, - "r_y1": 386.3333333333333, - "r_x2": 231.0, - "r_y2": 386.3333333333333, - "r_x3": 231.0, - "r_y3": 404.0, + "r_x0": 284.0, + "r_y0": 545.0, + "r_x1": 284.0, + "r_y1": 442.3333333333333, + "r_x2": 268.0, + "r_y2": 442.3333333333333, + "r_x3": 268.0, + "r_y3": 545.0, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 0.96640068, + "confidence": 93.0, "from_ocr": true } ], "children": [] }, { - "id": 2, + "id": 10, "label": "text", "bbox": { - "l": 228.66666666666669, - "t": 279.0, - "r": 237.33333333333331, - "b": 326.33333333333337, + "l": 299.66666666666663, + "t": 468.0, + "r": 315.33333333333337, + "b": 515.0, "coord_origin": "TOPLEFT" }, - "confidence": 0.9143174290657043, + "confidence": 96.0, "cells": [ { "index": 9, @@ -3304,22 +4497,37 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 326.33333333333337, - "r_x1": 237.33333333333331, - "r_y1": 299.0, - "r_x2": 231.0, - "r_y2": 299.0, - "r_x3": 231.0, - "r_y3": 326.33333333333337, + "r_x0": 315.33333333333337, + "r_y0": 515.0, + "r_x1": 315.33333333333337, + "r_y1": 468.0, + "r_x2": 299.66666666666663, + "r_y2": 468.0, + "r_x3": 299.66666666666663, + "r_y3": 515.0, "coord_origin": "TOPLEFT" }, - "text": "some", - "orig": "some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.96376541, + "confidence": 96.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 11, + "label": "text", + "bbox": { + "l": 105.66666666666666, + "t": 274.0, + "r": 121.66666666666666, + "b": 385.6666666666667, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 10, "rgba": { @@ -3329,36 +4537,36 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 295.33333333333337, - "r_x1": 237.33333333333331, - "r_y1": 279.0, - "r_x2": 228.66666666666669, - "r_y2": 279.0, - "r_x3": 228.66666666666669, - "r_y3": 295.33333333333337, + "r_x0": 121.66666666666666, + "r_y0": 385.6666666666667, + "r_x1": 121.66666666666666, + "r_y1": 274.0, + "r_x2": 105.66666666666666, + "r_y2": 274.0, + "r_x3": 105.66666666666666, + "r_y3": 385.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "cell", - "orig": "cell", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.95824509, + "confidence": 95.0, "from_ocr": true } ], "children": [] }, { - "id": 6, + "id": 12, "label": "text", "bbox": { - "l": 228.66666666666669, - "t": 149.0, - "r": 237.33333333333331, - "b": 213.66666666666666, + "l": 137.0, + "t": 292.66666666666663, + "r": 153.0, + "b": 363.0, "coord_origin": "TOPLEFT" }, - "confidence": 0.9003775715827942, + "confidence": 94.0, "cells": [ { "index": 11, @@ -3369,22 +4577,37 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 213.66666666666666, - "r_x1": 237.33333333333331, - "r_y1": 190.0, - "r_x2": 228.66666666666669, - "r_y2": 190.0, - "r_x3": 228.66666666666669, - "r_y3": 213.66666666666666, + "r_x0": 153.0, + "r_y0": 363.0, + "r_x1": 153.0, + "r_y1": 292.66666666666663, + "r_x2": 137.0, + "r_y2": 292.66666666666663, + "r_x3": 137.0, + "r_y3": 363.0, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 0.9643471499999999, + "confidence": 94.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 13, + "label": "text", + "bbox": { + "l": 188.33333333333331, + "t": 278.0, + "r": 204.33333333333334, + "b": 384.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 12, "rgba": { @@ -3394,36 +4617,36 @@ "a": 255 }, "rect": { - "r_x0": 237.33333333333331, - "r_y0": 186.0, - "r_x1": 237.33333333333331, - "r_y1": 149.0, - "r_x2": 229.0, - "r_y2": 149.0, - "r_x3": 229.0, - "r_y3": 186.0, + "r_x0": 204.33333333333334, + "r_y0": 384.0, + "r_x1": 204.33333333333334, + "r_y1": 278.0, + "r_x2": 188.33333333333331, + "r_y2": 278.0, + "r_x3": 188.33333333333331, + "r_y3": 384.0, "coord_origin": "TOPLEFT" }, - "text": "content", - "orig": "content", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.96289528, + "confidence": 95.0, "from_ocr": true } ], "children": [] }, { - "id": 1, + "id": 14, "label": "text", "bbox": { - "l": 275.0, - "t": 371.6666666666667, - "r": 283.66666666666663, - "b": 451.6666666666667, + "l": 220.0, + "t": 304.33333333333337, + "r": 236.0, + "b": 351.33333333333337, "coord_origin": "TOPLEFT" }, - "confidence": 0.9147250652313232, + "confidence": 95.0, "cells": [ { "index": 13, @@ -3434,22 +4657,37 @@ "a": 255 }, "rect": { - "r_x0": 283.66666666666663, - "r_y0": 451.6666666666667, - "r_x1": 283.66666666666663, - "r_y1": 422.6666666666667, - "r_x2": 275.0, - "r_y2": 422.6666666666667, - "r_x3": 275.0, - "r_y3": 451.6666666666667, + "r_x0": 236.0, + "r_y0": 351.33333333333337, + "r_x1": 236.0, + "r_y1": 304.33333333333337, + "r_x2": 220.0, + "r_y2": 304.33333333333337, + "r_x3": 220.0, + "r_y3": 351.33333333333337, "coord_origin": "TOPLEFT" }, - "text": "Some", - "orig": "Some", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.9611363199999999, + "confidence": 95.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 15, + "label": "text", + "bbox": { + "l": 268.0, + "t": 278.0, + "r": 284.0, + "b": 383.6666666666667, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 14, "rgba": { @@ -3459,22 +4697,37 @@ "a": 255 }, "rect": { - "r_x0": 283.66666666666663, - "r_y0": 419.0, - "r_x1": 283.66666666666663, - "r_y1": 393.0, - "r_x2": 275.0, - "r_y2": 393.0, - "r_x3": 275.0, - "r_y3": 419.0, + "r_x0": 284.0, + "r_y0": 383.6666666666667, + "r_x1": 284.0, + "r_y1": 278.0, + "r_x2": 268.0, + "r_y2": 278.0, + "r_x3": 268.0, + "r_y3": 383.6666666666667, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 0.9588653600000001, + "confidence": 95.0, "from_ocr": true - }, + } + ], + "children": [] + }, + { + "id": 16, + "label": "text", + "bbox": { + "l": 299.66666666666663, + "t": 304.33333333333337, + "r": 315.33333333333337, + "b": 351.33333333333337, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ { "index": 15, "rgba": { @@ -3484,85 +4737,20 @@ "a": 255 }, "rect": { - "r_x0": 283.66666666666663, - "r_y0": 389.3333333333333, - "r_x1": 283.66666666666663, - "r_y1": 371.6666666666667, - "r_x2": 277.33333333333337, - "r_y2": 371.6666666666667, - "r_x3": 277.33333333333337, - "r_y3": 389.3333333333333, + "r_x0": 315.33333333333337, + "r_y0": 351.33333333333337, + "r_x1": 315.33333333333337, + "r_y1": 304.33333333333337, + "r_x2": 299.66666666666663, + "r_y2": 304.33333333333337, + "r_x3": 299.66666666666663, + "r_y3": 351.33333333333337, "coord_origin": "TOPLEFT" }, - "text": "row", - "orig": "row", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 0.95681549, - "from_ocr": true - } - ], - "children": [] - }, - { - "id": 3, - "label": "text", - "bbox": { - "l": 275.0, - "t": 275.66666666666663, - "r": 283.66666666666663, - "b": 329.0, - "coord_origin": "TOPLEFT" - }, - "confidence": 0.9124712347984314, - "cells": [ - { - "index": 16, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 283.66666666666663, - "r_y0": 329.0, - "r_x1": 283.66666666666663, - "r_y1": 303.0, - "r_x2": 275.0, - "r_y2": 303.0, - "r_x3": 275.0, - "r_y3": 329.0, - "coord_origin": "TOPLEFT" - }, - "text": "other", - "orig": "other", - "text_direction": "left_to_right", - "confidence": 0.9589106, - "from_ocr": true - }, - { - "index": 17, - "rgba": { - "r": 0, - "g": 0, - "b": 0, - "a": 255 - }, - "rect": { - "r_x0": 283.66666666666663, - "r_y0": 299.66666666666663, - "r_x1": 283.66666666666663, - "r_y1": 275.66666666666663, - "r_x2": 275.0, - "r_y2": 275.66666666666663, - "r_x3": 275.0, - "r_y3": 299.66666666666663, - "coord_origin": "TOPLEFT" - }, - "text": "don't", - "orig": "don't", - "text_direction": "left_to_right", - "confidence": 0.96121948, + "confidence": 95.0, "from_ocr": true } ], @@ -3570,7 +4758,24 @@ } ] }, - "text": null + "text": null, + "otsl_seq": [ + "ched", + "ched", + "ched", + "nl", + "fcel", + "fcel", + "fcel", + "nl", + "fcel", + "fcel", + "fcel", + "nl" + ], + "num_rows": 0, + "num_cols": 0, + "table_cells": [] } ], "headers": [] diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test.doctags.txt b/tests/data_scanned/groundtruth/docling_v2/ocr_test.doctags.txt index 89a0eb20..73f13805 100644 --- a/tests/data_scanned/groundtruth/docling_v2/ocr_test.doctags.txt +++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test.doctags.txt @@ -1,2 +1,2 @@ -Column 0Column 1Column 2this is row 0some cellshave contentandand row 1otherhaveand last row 2nothinginside +Vertically mergedOther merged columnYet another columnvalueSome other valueYet another valuevalueSome other valueYet another value \ No newline at end of file diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test.json b/tests/data_scanned/groundtruth/docling_v2/ocr_test.json index e0be74fe..f0ed675a 100644 --- a/tests/data_scanned/groundtruth/docling_v2/ocr_test.json +++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test.json @@ -4,7 +4,7 @@ "name": "ocr_test", "origin": { "mimetype": "application/pdf", - "binary_hash": 3906211175708501508, + "binary_hash": 14846044078209721391, "filename": "ocr_test.pdf" }, "furniture": { @@ -41,10 +41,10 @@ { "page_no": 1, "bbox": { - "l": 103.33, - "t": 519.86, - "r": 560.95, - "b": 234.07, + "l": 69.05, + "t": 524.35, + "r": 551.1, + "b": 277.42, "coord_origin": "BOTTOMLEFT" }, "charspan": [ @@ -60,67 +60,29 @@ "table_cells": [ { "bbox": { - "l": 245.02, - "t": 106.57, - "r": 307.59, - "b": 120.29, + "l": 97.33, + "t": 105.67, + "r": 190.0, + "b": 126.33, "coord_origin": "TOPLEFT" }, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "Column 0", + "start_col_offset_idx": 0, + "end_col_offset_idx": 1, + "text": "Vertically merged", "column_header": true, "row_header": false, "row_section": false }, { "bbox": { - "l": 358.65, - "t": 106.57, - "r": 421.22, - "b": 120.29, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "Column 1", - "column_header": true, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 472.27, - "t": 106.57, - "r": 534.84, - "b": 120.29, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "Column 2", - "column_header": true, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 123.52, - "t": 174.07, - "r": 200.67, - "b": 187.79, + "l": 121.67, + "t": 204.33, + "r": 168.67, + "b": 220.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -129,74 +91,17 @@ "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, - "text": "this is row 0", - "column_header": false, - "row_header": true, - "row_section": false - }, - { - "bbox": { - "l": 241.65, - "t": 174.07, - "r": 310.71, - "b": 187.79, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "some cells", + "text": "value", "column_header": false, "row_header": false, "row_section": false }, { "bbox": { - "l": 347.4, - "t": 174.07, - "r": 431.1, - "b": 187.79, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "have content", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 491.4, - "t": 174.07, - "r": 515.79, - "b": 187.79, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "and", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 130.27, - "t": 242.7, - "r": 194.46, - "b": 256.41, + "l": 121.67, + "t": 284.0, + "r": 168.67, + "b": 300.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -205,17 +110,112 @@ "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, - "text": "and row 1", + "text": "value", "column_header": false, - "row_header": true, + "row_header": false, "row_section": false }, { "bbox": { - "l": 373.27, - "t": 242.7, - "r": 406.59, - "b": 256.41, + "l": 232.67, + "t": 105.67, + "r": 364.0, + "b": 126.33, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Other merged column", + "column_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 247.0, + "t": 188.33, + "r": 349.67, + "b": 204.33, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Some other value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 247.0, + "t": 268.0, + "r": 349.67, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 2, + "end_row_offset_idx": 3, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Some other value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 406.33, + "t": 105.67, + "r": 518.33, + "b": 121.67, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another column", + "column_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 408.33, + "t": 188.33, + "r": 514.0, + "b": 204.33, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 408.33, + "t": 268.0, + "r": 514.0, + "b": 284.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -224,110 +224,41 @@ "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, - "text": "other", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 486.9, - "t": 242.7, - "r": 518.61, - "b": 256.41, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "have", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 116.77, - "t": 315.82, - "r": 207.76, - "b": 329.54, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "and last row 2", - "column_header": false, - "row_header": true, - "row_section": false - }, - { - "bbox": { - "l": 251.77, - "t": 315.82, - "r": 299.73, - "b": 329.54, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "nothing", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 484.65, - "t": 315.82, - "r": 522.85, - "b": 329.54, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "inside", + "text": "Yet another value", "column_header": false, "row_header": false, "row_section": false } ], - "num_rows": 4, - "num_cols": 4, + "num_rows": 3, + "num_cols": 3, "grid": [ [ { + "bbox": { + "l": 97.33, + "t": 105.67, + "r": 190.0, + "b": 126.33, + "coord_origin": "TOPLEFT" + }, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, - "text": "", - "column_header": false, + "text": "Vertically merged", + "column_header": true, "row_header": false, "row_section": false }, { "bbox": { - "l": 245.02, - "t": 106.57, - "r": 307.59, - "b": 120.29, + "l": 232.67, + "t": 105.67, + "r": 364.0, + "b": 126.33, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -336,17 +267,17 @@ "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, - "text": "Column 0", + "text": "Other merged column", "column_header": true, "row_header": false, "row_section": false }, { "bbox": { - "l": 358.65, - "t": 106.57, - "r": 421.22, - "b": 120.29, + "l": 406.33, + "t": 105.67, + "r": 518.33, + "b": 121.67, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -355,26 +286,7 @@ "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, - "text": "Column 1", - "column_header": true, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 472.27, - "t": 106.57, - "r": 534.84, - "b": 120.29, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "Column 2", + "text": "Yet another column", "column_header": true, "row_header": false, "row_section": false @@ -383,10 +295,10 @@ [ { "bbox": { - "l": 123.52, - "t": 174.07, - "r": 200.67, - "b": 187.79, + "l": 121.67, + "t": 204.33, + "r": 168.67, + "b": 220.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -395,17 +307,17 @@ "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, - "text": "this is row 0", + "text": "value", "column_header": false, - "row_header": true, + "row_header": false, "row_section": false }, { "bbox": { - "l": 241.65, - "t": 174.07, - "r": 310.71, - "b": 187.79, + "l": 247.0, + "t": 188.33, + "r": 349.67, + "b": 204.33, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -414,17 +326,17 @@ "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, - "text": "some cells", + "text": "Some other value", "column_header": false, "row_header": false, "row_section": false }, { "bbox": { - "l": 347.4, - "t": 174.07, - "r": 431.1, - "b": 187.79, + "l": 408.33, + "t": 188.33, + "r": 514.0, + "b": 204.33, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -433,26 +345,7 @@ "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, - "text": "have content", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 491.4, - "t": 174.07, - "r": 515.79, - "b": 187.79, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "and", + "text": "Yet another value", "column_header": false, "row_header": false, "row_section": false @@ -461,10 +354,10 @@ [ { "bbox": { - "l": 130.27, - "t": 242.7, - "r": 194.46, - "b": 256.41, + "l": 121.67, + "t": 284.0, + "r": 168.67, + "b": 300.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -473,29 +366,36 @@ "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, - "text": "and row 1", - "column_header": false, - "row_header": true, - "row_section": false - }, - { - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "", + "text": "value", "column_header": false, "row_header": false, "row_section": false }, { "bbox": { - "l": 373.27, - "t": 242.7, - "r": 406.59, - "b": 256.41, + "l": 247.0, + "t": 268.0, + "r": 349.67, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 2, + "end_row_offset_idx": 3, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Some other value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 408.33, + "t": 268.0, + "r": 514.0, + "b": 284.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -504,97 +404,7 @@ "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, - "text": "other", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 486.9, - "t": 242.7, - "r": 518.61, - "b": 256.41, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "have", - "column_header": false, - "row_header": false, - "row_section": false - } - ], - [ - { - "bbox": { - "l": 116.77, - "t": 315.82, - "r": 207.76, - "b": 329.54, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "and last row 2", - "column_header": false, - "row_header": true, - "row_section": false - }, - { - "bbox": { - "l": 251.77, - "t": 315.82, - "r": 299.73, - "b": 329.54, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "nothing", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 484.65, - "t": 315.82, - "r": 522.85, - "b": 329.54, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "inside", + "text": "Yet another value", "column_header": false, "row_header": false, "row_section": false @@ -610,8 +420,8 @@ "pages": { "1": { "size": { - "width": 842.0, - "height": 595.0 + "width": 792.0, + "height": 612.0 }, "page_no": 1 } diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test.md b/tests/data_scanned/groundtruth/docling_v2/ocr_test.md index c466de2b..e3d7c0b8 100644 --- a/tests/data_scanned/groundtruth/docling_v2/ocr_test.md +++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test.md @@ -1,5 +1,4 @@ -| | Column 0 | Column 1 | Column 2 | -|----------------|------------|--------------|------------| -| this is row 0 | some cells | have content | and | -| and row 1 | | other | have | -| and last row 2 | nothing | | inside | \ No newline at end of file +| Vertically merged | Other merged column | Yet another column | +|---------------------|-----------------------|----------------------| +| value | Some other value | Yet another value | +| value | Some other value | Yet another value | \ No newline at end of file diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test.pages.json b/tests/data_scanned/groundtruth/docling_v2/ocr_test.pages.json index e3613adc..4470bece 100644 --- a/tests/data_scanned/groundtruth/docling_v2/ocr_test.pages.json +++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test.pages.json @@ -2,8 +2,8 @@ { "page_no": 0, "size": { - "width": 842.0, - "height": 595.0 + "width": 792.0, + "height": 612.0 }, "parsed_page": { "dimension": { @@ -11,47 +11,47 @@ "rect": { "r_x0": 0.0, "r_y0": 0.0, - "r_x1": 842.0, + "r_x1": 792.0, "r_y1": 0.0, - "r_x2": 842.0, - "r_y2": 595.0, + "r_x2": 792.0, + "r_y2": 612.0, "r_x3": 0.0, - "r_y3": 595.0, + "r_y3": 612.0, "coord_origin": "BOTTOMLEFT" }, "boundary_type": "crop_box", "art_bbox": { "l": 0.0, - "t": 595.0, - "r": 842.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" }, "bleed_bbox": { "l": 0.0, - "t": 595.0, - "r": 842.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" }, "crop_bbox": { "l": 0.0, - "t": 595.0, - "r": 842.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" }, "media_bbox": { "l": 0.0, - "t": 595.0, - "r": 842.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" }, "trim_bbox": { "l": 0.0, - "t": 595.0, - "r": 842.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" } @@ -69,21 +69,21 @@ "a": 255 }, "rect": { - "r_x0": 245.02, - "r_y0": 120.29, - "r_x1": 307.59, - "r_y1": 120.29, - "r_x2": 307.59, - "r_y2": 106.57, - "r_x3": 245.02, - "r_y3": 106.57, + "r_x0": 97.33, + "r_y0": 126.33, + "r_x1": 190.0, + "r_y1": 126.33, + "r_x2": 190.0, + "r_y2": 105.67, + "r_x3": 97.33, + "r_y3": 105.67, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 89.0, + "from_ocr": true }, { "index": 1, @@ -94,21 +94,21 @@ "a": 255 }, "rect": { - "r_x0": 358.65, - "r_y0": 120.29, - "r_x1": 421.22, - "r_y1": 120.29, - "r_x2": 421.22, - "r_y2": 106.57, - "r_x3": 358.65, - "r_y3": 106.57, + "r_x0": 112.0, + "r_y0": 157.67, + "r_x1": 182.33, + "r_y1": 157.67, + "r_x2": 182.33, + "r_y2": 137.0, + "r_x3": 112.0, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 2, @@ -119,21 +119,21 @@ "a": 255 }, "rect": { - "r_x0": 472.27, - "r_y0": 120.29, - "r_x1": 534.84, - "r_y1": 120.29, - "r_x2": 534.84, - "r_y2": 106.57, - "r_x3": 472.27, - "r_y3": 106.57, + "r_x0": 121.67, + "r_y0": 220.0, + "r_x1": 168.67, + "r_y1": 220.0, + "r_x2": 168.67, + "r_y2": 204.33, + "r_x3": 121.67, + "r_y3": 204.33, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 3, @@ -144,21 +144,21 @@ "a": 255 }, "rect": { - "r_x0": 123.52, - "r_y0": 187.79, - "r_x1": 200.67, - "r_y1": 187.79, - "r_x2": 200.67, - "r_y2": 174.07, - "r_x3": 123.52, - "r_y3": 174.07, + "r_x0": 121.67, + "r_y0": 300.0, + "r_x1": 168.67, + "r_y1": 300.0, + "r_x2": 168.67, + "r_y2": 284.0, + "r_x3": 121.67, + "r_y3": 284.0, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 4, @@ -169,21 +169,21 @@ "a": 255 }, "rect": { - "r_x0": 241.65, - "r_y0": 187.79, - "r_x1": 310.71, - "r_y1": 187.79, - "r_x2": 310.71, - "r_y2": 174.07, - "r_x3": 241.65, - "r_y3": 174.07, + "r_x0": 232.67, + "r_y0": 126.33, + "r_x1": 364.0, + "r_y1": 126.33, + "r_x2": 364.0, + "r_y2": 105.67, + "r_x3": 232.67, + "r_y3": 105.67, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 5, @@ -194,21 +194,21 @@ "a": 255 }, "rect": { - "r_x0": 347.4, - "r_y0": 187.79, - "r_x1": 431.1, - "r_y1": 187.79, - "r_x2": 431.1, - "r_y2": 174.07, - "r_x3": 347.4, - "r_y3": 174.07, + "r_x0": 265.67, + "r_y0": 153.0, + "r_x1": 336.0, + "r_y1": 153.0, + "r_x2": 336.0, + "r_y2": 137.0, + "r_x3": 265.67, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 6, @@ -219,21 +219,21 @@ "a": 255 }, "rect": { - "r_x0": 491.4, - "r_y0": 187.79, - "r_x1": 515.79, - "r_y1": 187.79, - "r_x2": 515.79, - "r_y2": 174.07, - "r_x3": 491.4, - "r_y3": 174.07, + "r_x0": 247.0, + "r_y0": 204.33, + "r_x1": 349.67, + "r_y1": 204.33, + "r_x2": 349.67, + "r_y2": 188.33, + "r_x3": 247.0, + "r_y3": 188.33, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 7, @@ -244,21 +244,21 @@ "a": 255 }, "rect": { - "r_x0": 130.27, - "r_y0": 256.41, - "r_x1": 194.46, - "r_y1": 256.41, - "r_x2": 194.46, - "r_y2": 242.7, - "r_x3": 130.27, - "r_y3": 242.7, + "r_x0": 277.0, + "r_y0": 236.0, + "r_x1": 324.33, + "r_y1": 236.0, + "r_x2": 324.33, + "r_y2": 220.0, + "r_x3": 277.0, + "r_y3": 220.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 8, @@ -269,21 +269,21 @@ "a": 255 }, "rect": { - "r_x0": 373.27, - "r_y0": 256.41, - "r_x1": 406.59, - "r_y1": 256.41, - "r_x2": 406.59, - "r_y2": 242.7, - "r_x3": 373.27, - "r_y3": 242.7, + "r_x0": 247.0, + "r_y0": 284.0, + "r_x1": 349.67, + "r_y1": 284.0, + "r_x2": 349.67, + "r_y2": 268.0, + "r_x3": 247.0, + "r_y3": 268.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 9, @@ -294,21 +294,21 @@ "a": 255 }, "rect": { - "r_x0": 486.9, - "r_y0": 256.41, - "r_x1": 518.61, - "r_y1": 256.41, - "r_x2": 518.61, - "r_y2": 242.7, - "r_x3": 486.9, - "r_y3": 242.7, + "r_x0": 277.0, + "r_y0": 315.33, + "r_x1": 324.33, + "r_y1": 315.33, + "r_x2": 324.33, + "r_y2": 299.67, + "r_x3": 277.0, + "r_y3": 299.67, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 10, @@ -319,21 +319,21 @@ "a": 255 }, "rect": { - "r_x0": 116.77, - "r_y0": 329.54, - "r_x1": 207.76, - "r_y1": 329.54, - "r_x2": 207.76, - "r_y2": 315.82, - "r_x3": 116.77, - "r_y3": 315.82, + "r_x0": 406.33, + "r_y0": 121.67, + "r_x1": 518.33, + "r_y1": 121.67, + "r_x2": 518.33, + "r_y2": 105.67, + "r_x3": 406.33, + "r_y3": 105.67, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 11, @@ -344,21 +344,21 @@ "a": 255 }, "rect": { - "r_x0": 251.77, - "r_y0": 329.54, - "r_x1": 299.73, - "r_y1": 329.54, - "r_x2": 299.73, - "r_y2": 315.82, - "r_x3": 251.77, - "r_y3": 315.82, + "r_x0": 429.33, + "r_y0": 153.0, + "r_x1": 499.33, + "r_y1": 153.0, + "r_x2": 499.33, + "r_y2": 137.0, + "r_x3": 429.33, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 12, @@ -369,21 +369,96 @@ "a": 255 }, "rect": { - "r_x0": 484.65, - "r_y0": 329.54, - "r_x1": 522.85, - "r_y1": 329.54, - "r_x2": 522.85, - "r_y2": 315.82, - "r_x3": 484.65, - "r_y3": 315.82, + "r_x0": 408.33, + "r_y0": 204.33, + "r_x1": 514.0, + "r_y1": 204.33, + "r_x2": 514.0, + "r_y2": 188.33, + "r_x3": 408.33, + "r_y3": 188.33, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 440.67, + "r_y0": 236.0, + "r_x1": 487.67, + "r_y1": 236.0, + "r_x2": 487.67, + "r_y2": 220.0, + "r_x3": 440.67, + "r_y3": 220.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 408.33, + "r_y0": 284.0, + "r_x1": 514.0, + "r_y1": 284.0, + "r_x2": 514.0, + "r_y2": 268.0, + "r_x3": 408.33, + "r_y3": 268.0, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 440.67, + "r_y0": 315.33, + "r_x1": 487.67, + "r_y1": 315.33, + "r_x2": 487.67, + "r_y2": 299.67, + "r_x3": 440.67, + "r_y3": 299.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "has_chars": false, @@ -399,13 +474,13 @@ "id": 0, "label": "table", "bbox": { - "l": 103.33, - "t": 75.14, - "r": 560.95, - "b": 360.93, + "l": 69.05, + "t": 87.65, + "r": 551.1, + "b": 334.58, "coord_origin": "TOPLEFT" }, - "confidence": 0.968, + "confidence": 0.979, "cells": [ { "index": 0, @@ -416,21 +491,21 @@ "a": 255 }, "rect": { - "r_x0": 245.02, - "r_y0": 120.29, - "r_x1": 307.59, - "r_y1": 120.29, - "r_x2": 307.59, - "r_y2": 106.57, - "r_x3": 245.02, - "r_y3": 106.57, + "r_x0": 97.33, + "r_y0": 126.33, + "r_x1": 190.0, + "r_y1": 126.33, + "r_x2": 190.0, + "r_y2": 105.67, + "r_x3": 97.33, + "r_y3": 105.67, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 89.0, + "from_ocr": true }, { "index": 1, @@ -441,21 +516,21 @@ "a": 255 }, "rect": { - "r_x0": 358.65, - "r_y0": 120.29, - "r_x1": 421.22, - "r_y1": 120.29, - "r_x2": 421.22, - "r_y2": 106.57, - "r_x3": 358.65, - "r_y3": 106.57, + "r_x0": 112.0, + "r_y0": 157.67, + "r_x1": 182.33, + "r_y1": 157.67, + "r_x2": 182.33, + "r_y2": 137.0, + "r_x3": 112.0, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 2, @@ -466,21 +541,21 @@ "a": 255 }, "rect": { - "r_x0": 472.27, - "r_y0": 120.29, - "r_x1": 534.84, - "r_y1": 120.29, - "r_x2": 534.84, - "r_y2": 106.57, - "r_x3": 472.27, - "r_y3": 106.57, + "r_x0": 121.67, + "r_y0": 220.0, + "r_x1": 168.67, + "r_y1": 220.0, + "r_x2": 168.67, + "r_y2": 204.33, + "r_x3": 121.67, + "r_y3": 204.33, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 3, @@ -491,21 +566,21 @@ "a": 255 }, "rect": { - "r_x0": 123.52, - "r_y0": 187.79, - "r_x1": 200.67, - "r_y1": 187.79, - "r_x2": 200.67, - "r_y2": 174.07, - "r_x3": 123.52, - "r_y3": 174.07, + "r_x0": 121.67, + "r_y0": 300.0, + "r_x1": 168.67, + "r_y1": 300.0, + "r_x2": 168.67, + "r_y2": 284.0, + "r_x3": 121.67, + "r_y3": 284.0, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 4, @@ -516,21 +591,21 @@ "a": 255 }, "rect": { - "r_x0": 241.65, - "r_y0": 187.79, - "r_x1": 310.71, - "r_y1": 187.79, - "r_x2": 310.71, - "r_y2": 174.07, - "r_x3": 241.65, - "r_y3": 174.07, + "r_x0": 232.67, + "r_y0": 126.33, + "r_x1": 364.0, + "r_y1": 126.33, + "r_x2": 364.0, + "r_y2": 105.67, + "r_x3": 232.67, + "r_y3": 105.67, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 5, @@ -541,21 +616,21 @@ "a": 255 }, "rect": { - "r_x0": 347.4, - "r_y0": 187.79, - "r_x1": 431.1, - "r_y1": 187.79, - "r_x2": 431.1, - "r_y2": 174.07, - "r_x3": 347.4, - "r_y3": 174.07, + "r_x0": 265.67, + "r_y0": 153.0, + "r_x1": 336.0, + "r_y1": 153.0, + "r_x2": 336.0, + "r_y2": 137.0, + "r_x3": 265.67, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 6, @@ -566,21 +641,21 @@ "a": 255 }, "rect": { - "r_x0": 491.4, - "r_y0": 187.79, - "r_x1": 515.79, - "r_y1": 187.79, - "r_x2": 515.79, - "r_y2": 174.07, - "r_x3": 491.4, - "r_y3": 174.07, + "r_x0": 247.0, + "r_y0": 204.33, + "r_x1": 349.67, + "r_y1": 204.33, + "r_x2": 349.67, + "r_y2": 188.33, + "r_x3": 247.0, + "r_y3": 188.33, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 7, @@ -591,21 +666,21 @@ "a": 255 }, "rect": { - "r_x0": 130.27, - "r_y0": 256.41, - "r_x1": 194.46, - "r_y1": 256.41, - "r_x2": 194.46, - "r_y2": 242.7, - "r_x3": 130.27, - "r_y3": 242.7, + "r_x0": 277.0, + "r_y0": 236.0, + "r_x1": 324.33, + "r_y1": 236.0, + "r_x2": 324.33, + "r_y2": 220.0, + "r_x3": 277.0, + "r_y3": 220.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 8, @@ -616,21 +691,21 @@ "a": 255 }, "rect": { - "r_x0": 373.27, - "r_y0": 256.41, - "r_x1": 406.59, - "r_y1": 256.41, - "r_x2": 406.59, - "r_y2": 242.7, - "r_x3": 373.27, - "r_y3": 242.7, + "r_x0": 247.0, + "r_y0": 284.0, + "r_x1": 349.67, + "r_y1": 284.0, + "r_x2": 349.67, + "r_y2": 268.0, + "r_x3": 247.0, + "r_y3": 268.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 9, @@ -641,21 +716,21 @@ "a": 255 }, "rect": { - "r_x0": 486.9, - "r_y0": 256.41, - "r_x1": 518.61, - "r_y1": 256.41, - "r_x2": 518.61, - "r_y2": 242.7, - "r_x3": 486.9, - "r_y3": 242.7, + "r_x0": 277.0, + "r_y0": 315.33, + "r_x1": 324.33, + "r_y1": 315.33, + "r_x2": 324.33, + "r_y2": 299.67, + "r_x3": 277.0, + "r_y3": 299.67, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 10, @@ -666,21 +741,21 @@ "a": 255 }, "rect": { - "r_x0": 116.77, - "r_y0": 329.54, - "r_x1": 207.76, - "r_y1": 329.54, - "r_x2": 207.76, - "r_y2": 315.82, - "r_x3": 116.77, - "r_y3": 315.82, + "r_x0": 406.33, + "r_y0": 121.67, + "r_x1": 518.33, + "r_y1": 121.67, + "r_x2": 518.33, + "r_y2": 105.67, + "r_x3": 406.33, + "r_y3": 105.67, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 11, @@ -691,21 +766,21 @@ "a": 255 }, "rect": { - "r_x0": 251.77, - "r_y0": 329.54, - "r_x1": 299.73, - "r_y1": 329.54, - "r_x2": 299.73, - "r_y2": 315.82, - "r_x3": 251.77, - "r_y3": 315.82, + "r_x0": 429.33, + "r_y0": 153.0, + "r_x1": 499.33, + "r_y1": 153.0, + "r_x2": 499.33, + "r_y2": 137.0, + "r_x3": 429.33, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 12, @@ -716,35 +791,110 @@ "a": 255 }, "rect": { - "r_x0": 484.65, - "r_y0": 329.54, - "r_x1": 522.85, - "r_y1": 329.54, - "r_x2": 522.85, - "r_y2": 315.82, - "r_x3": 484.65, - "r_y3": 315.82, + "r_x0": 408.33, + "r_y0": 204.33, + "r_x1": 514.0, + "r_y1": 204.33, + "r_x2": 514.0, + "r_y2": 188.33, + "r_x3": 408.33, + "r_y3": 188.33, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 440.67, + "r_y0": 236.0, + "r_x1": 487.67, + "r_y1": 236.0, + "r_x2": 487.67, + "r_y2": 220.0, + "r_x3": 440.67, + "r_y3": 220.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 408.33, + "r_y0": 284.0, + "r_x1": 514.0, + "r_y1": 284.0, + "r_x2": 514.0, + "r_y2": 268.0, + "r_x3": 408.33, + "r_y3": 268.0, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 440.67, + "r_y0": 315.33, + "r_x1": 487.67, + "r_y1": 315.33, + "r_x2": 487.67, + "r_y2": 299.67, + "r_x3": 440.67, + "r_y3": 299.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "children": [ { - "id": 14, + "id": 1, "label": "text", "bbox": { - "l": 245.02, - "t": 106.57, - "r": 307.59, - "b": 120.29, + "l": 97.33, + "t": 105.67, + "r": 190.0, + "b": 126.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 89.0, "cells": [ { "index": 0, @@ -755,36 +905,36 @@ "a": 255 }, "rect": { - "r_x0": 245.02, - "r_y0": 120.29, - "r_x1": 307.59, - "r_y1": 120.29, - "r_x2": 307.59, - "r_y2": 106.57, - "r_x3": 245.02, - "r_y3": 106.57, + "r_x0": 97.33, + "r_y0": 126.33, + "r_x1": 190.0, + "r_y1": 126.33, + "r_x2": 190.0, + "r_y2": 105.67, + "r_x3": 97.33, + "r_y3": 105.67, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 89.0, + "from_ocr": true } ], "children": [] }, { - "id": 15, + "id": 2, "label": "text", "bbox": { - "l": 358.65, - "t": 106.57, - "r": 421.22, - "b": 120.29, + "l": 112.0, + "t": 137.0, + "r": 182.33, + "b": 157.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 92.0, "cells": [ { "index": 1, @@ -795,36 +945,36 @@ "a": 255 }, "rect": { - "r_x0": 358.65, - "r_y0": 120.29, - "r_x1": 421.22, - "r_y1": 120.29, - "r_x2": 421.22, - "r_y2": 106.57, - "r_x3": 358.65, - "r_y3": 106.57, + "r_x0": 112.0, + "r_y0": 157.67, + "r_x1": 182.33, + "r_y1": 157.67, + "r_x2": 182.33, + "r_y2": 137.0, + "r_x3": 112.0, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true } ], "children": [] }, { - "id": 16, + "id": 3, "label": "text", "bbox": { - "l": 472.27, - "t": 106.57, - "r": 534.84, - "b": 120.29, + "l": 121.67, + "t": 204.33, + "r": 168.67, + "b": 220.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 2, @@ -835,36 +985,36 @@ "a": 255 }, "rect": { - "r_x0": 472.27, - "r_y0": 120.29, - "r_x1": 534.84, - "r_y1": 120.29, - "r_x2": 534.84, - "r_y2": 106.57, - "r_x3": 472.27, - "r_y3": 106.57, + "r_x0": 121.67, + "r_y0": 220.0, + "r_x1": 168.67, + "r_y1": 220.0, + "r_x2": 168.67, + "r_y2": 204.33, + "r_x3": 121.67, + "r_y3": 204.33, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 17, + "id": 4, "label": "text", "bbox": { - "l": 123.52, - "t": 174.07, - "r": 200.67, - "b": 187.79, + "l": 121.67, + "t": 284.0, + "r": 168.67, + "b": 300.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 3, @@ -875,36 +1025,36 @@ "a": 255 }, "rect": { - "r_x0": 123.52, - "r_y0": 187.79, - "r_x1": 200.67, - "r_y1": 187.79, - "r_x2": 200.67, - "r_y2": 174.07, - "r_x3": 123.52, - "r_y3": 174.07, + "r_x0": 121.67, + "r_y0": 300.0, + "r_x1": 168.67, + "r_y1": 300.0, + "r_x2": 168.67, + "r_y2": 284.0, + "r_x3": 121.67, + "r_y3": 284.0, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 18, + "id": 5, "label": "text", "bbox": { - "l": 241.65, - "t": 174.07, - "r": 310.71, - "b": 187.79, + "l": 232.67, + "t": 105.67, + "r": 364.0, + "b": 126.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 92.0, "cells": [ { "index": 4, @@ -915,36 +1065,36 @@ "a": 255 }, "rect": { - "r_x0": 241.65, - "r_y0": 187.79, - "r_x1": 310.71, - "r_y1": 187.79, - "r_x2": 310.71, - "r_y2": 174.07, - "r_x3": 241.65, - "r_y3": 174.07, + "r_x0": 232.67, + "r_y0": 126.33, + "r_x1": 364.0, + "r_y1": 126.33, + "r_x2": 364.0, + "r_y2": 105.67, + "r_x3": 232.67, + "r_y3": 105.67, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true } ], "children": [] }, { - "id": 19, + "id": 6, "label": "text", "bbox": { - "l": 347.4, - "t": 174.07, - "r": 431.1, - "b": 187.79, + "l": 265.67, + "t": 137.0, + "r": 336.0, + "b": 153.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 5, @@ -955,36 +1105,36 @@ "a": 255 }, "rect": { - "r_x0": 347.4, - "r_y0": 187.79, - "r_x1": 431.1, - "r_y1": 187.79, - "r_x2": 431.1, - "r_y2": 174.07, - "r_x3": 347.4, - "r_y3": 174.07, + "r_x0": 265.67, + "r_y0": 153.0, + "r_x1": 336.0, + "r_y1": 153.0, + "r_x2": 336.0, + "r_y2": 137.0, + "r_x3": 265.67, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 20, + "id": 7, "label": "text", "bbox": { - "l": 491.4, - "t": 174.07, - "r": 515.79, - "b": 187.79, + "l": 247.0, + "t": 188.33, + "r": 349.67, + "b": 204.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 6, @@ -995,36 +1145,36 @@ "a": 255 }, "rect": { - "r_x0": 491.4, - "r_y0": 187.79, - "r_x1": 515.79, - "r_y1": 187.79, - "r_x2": 515.79, - "r_y2": 174.07, - "r_x3": 491.4, - "r_y3": 174.07, + "r_x0": 247.0, + "r_y0": 204.33, + "r_x1": 349.67, + "r_y1": 204.33, + "r_x2": 349.67, + "r_y2": 188.33, + "r_x3": 247.0, + "r_y3": 188.33, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 21, + "id": 8, "label": "text", "bbox": { - "l": 130.27, - "t": 242.7, - "r": 194.46, - "b": 256.41, + "l": 277.0, + "t": 220.0, + "r": 324.33, + "b": 236.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 7, @@ -1035,36 +1185,36 @@ "a": 255 }, "rect": { - "r_x0": 130.27, - "r_y0": 256.41, - "r_x1": 194.46, - "r_y1": 256.41, - "r_x2": 194.46, - "r_y2": 242.7, - "r_x3": 130.27, - "r_y3": 242.7, + "r_x0": 277.0, + "r_y0": 236.0, + "r_x1": 324.33, + "r_y1": 236.0, + "r_x2": 324.33, + "r_y2": 220.0, + "r_x3": 277.0, + "r_y3": 220.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 22, + "id": 9, "label": "text", "bbox": { - "l": 373.27, - "t": 242.7, - "r": 406.59, - "b": 256.41, + "l": 247.0, + "t": 268.0, + "r": 349.67, + "b": 284.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 92.0, "cells": [ { "index": 8, @@ -1075,36 +1225,36 @@ "a": 255 }, "rect": { - "r_x0": 373.27, - "r_y0": 256.41, - "r_x1": 406.59, - "r_y1": 256.41, - "r_x2": 406.59, - "r_y2": 242.7, - "r_x3": 373.27, - "r_y3": 242.7, + "r_x0": 247.0, + "r_y0": 284.0, + "r_x1": 349.67, + "r_y1": 284.0, + "r_x2": 349.67, + "r_y2": 268.0, + "r_x3": 247.0, + "r_y3": 268.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true } ], "children": [] }, { - "id": 23, + "id": 10, "label": "text", "bbox": { - "l": 486.9, - "t": 242.7, - "r": 518.61, - "b": 256.41, + "l": 277.0, + "t": 299.67, + "r": 324.33, + "b": 315.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 9, @@ -1115,36 +1265,36 @@ "a": 255 }, "rect": { - "r_x0": 486.9, - "r_y0": 256.41, - "r_x1": 518.61, - "r_y1": 256.41, - "r_x2": 518.61, - "r_y2": 242.7, - "r_x3": 486.9, - "r_y3": 242.7, + "r_x0": 277.0, + "r_y0": 315.33, + "r_x1": 324.33, + "r_y1": 315.33, + "r_x2": 324.33, + "r_y2": 299.67, + "r_x3": 277.0, + "r_y3": 299.67, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 24, + "id": 11, "label": "text", "bbox": { - "l": 116.77, - "t": 315.82, - "r": 207.76, - "b": 329.54, + "l": 406.33, + "t": 105.67, + "r": 518.33, + "b": 121.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 10, @@ -1155,36 +1305,36 @@ "a": 255 }, "rect": { - "r_x0": 116.77, - "r_y0": 329.54, - "r_x1": 207.76, - "r_y1": 329.54, - "r_x2": 207.76, - "r_y2": 315.82, - "r_x3": 116.77, - "r_y3": 315.82, + "r_x0": 406.33, + "r_y0": 121.67, + "r_x1": 518.33, + "r_y1": 121.67, + "r_x2": 518.33, + "r_y2": 105.67, + "r_x3": 406.33, + "r_y3": 105.67, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 25, + "id": 12, "label": "text", "bbox": { - "l": 251.77, - "t": 315.82, - "r": 299.73, - "b": 329.54, + "l": 429.33, + "t": 137.0, + "r": 499.33, + "b": 153.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 11, @@ -1195,36 +1345,36 @@ "a": 255 }, "rect": { - "r_x0": 251.77, - "r_y0": 329.54, - "r_x1": 299.73, - "r_y1": 329.54, - "r_x2": 299.73, - "r_y2": 315.82, - "r_x3": 251.77, - "r_y3": 315.82, + "r_x0": 429.33, + "r_y0": 153.0, + "r_x1": 499.33, + "r_y1": 153.0, + "r_x2": 499.33, + "r_y2": 137.0, + "r_x3": 429.33, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 26, + "id": 13, "label": "text", "bbox": { - "l": 484.65, - "t": 315.82, - "r": 522.85, - "b": 329.54, + "l": 408.33, + "t": 188.33, + "r": 514.0, + "b": 204.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 12, @@ -1235,21 +1385,141 @@ "a": 255 }, "rect": { - "r_x0": 484.65, - "r_y0": 329.54, - "r_x1": 522.85, - "r_y1": 329.54, - "r_x2": 522.85, - "r_y2": 315.82, - "r_x3": 484.65, - "r_y3": 315.82, + "r_x0": 408.33, + "r_y0": 204.33, + "r_x1": 514.0, + "r_y1": 204.33, + "r_x2": 514.0, + "r_y2": 188.33, + "r_x3": 408.33, + "r_y3": 188.33, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 14, + "label": "text", + "bbox": { + "l": 440.67, + "t": 220.0, + "r": 487.67, + "b": 236.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 440.67, + "r_y0": 236.0, + "r_x1": 487.67, + "r_y1": 236.0, + "r_x2": 487.67, + "r_y2": 220.0, + "r_x3": 440.67, + "r_y3": 220.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 15, + "label": "text", + "bbox": { + "l": 408.33, + "t": 268.0, + "r": 514.0, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 408.33, + "r_y0": 284.0, + "r_x1": 514.0, + "r_y1": 284.0, + "r_x2": 514.0, + "r_y2": 268.0, + "r_x3": 408.33, + "r_y3": 268.0, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 16, + "label": "text", + "bbox": { + "l": 440.67, + "t": 299.67, + "r": 487.67, + "b": 315.33, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 440.67, + "r_y0": 315.33, + "r_x1": 487.67, + "r_y1": 315.33, + "r_x2": 487.67, + "r_y2": 299.67, + "r_x3": 440.67, + "r_y3": 299.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "children": [] @@ -1268,13 +1538,13 @@ "id": 0, "label": "table", "bbox": { - "l": 103.33, - "t": 75.14, - "r": 560.95, - "b": 360.93, + "l": 69.05, + "t": 87.65, + "r": 551.1, + "b": 334.58, "coord_origin": "TOPLEFT" }, - "confidence": 0.968, + "confidence": 0.979, "cells": [ { "index": 0, @@ -1285,21 +1555,21 @@ "a": 255 }, "rect": { - "r_x0": 245.02, - "r_y0": 120.29, - "r_x1": 307.59, - "r_y1": 120.29, - "r_x2": 307.59, - "r_y2": 106.57, - "r_x3": 245.02, - "r_y3": 106.57, + "r_x0": 97.33, + "r_y0": 126.33, + "r_x1": 190.0, + "r_y1": 126.33, + "r_x2": 190.0, + "r_y2": 105.67, + "r_x3": 97.33, + "r_y3": 105.67, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 89.0, + "from_ocr": true }, { "index": 1, @@ -1310,21 +1580,21 @@ "a": 255 }, "rect": { - "r_x0": 358.65, - "r_y0": 120.29, - "r_x1": 421.22, - "r_y1": 120.29, - "r_x2": 421.22, - "r_y2": 106.57, - "r_x3": 358.65, - "r_y3": 106.57, + "r_x0": 112.0, + "r_y0": 157.67, + "r_x1": 182.33, + "r_y1": 157.67, + "r_x2": 182.33, + "r_y2": 137.0, + "r_x3": 112.0, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 2, @@ -1335,21 +1605,21 @@ "a": 255 }, "rect": { - "r_x0": 472.27, - "r_y0": 120.29, - "r_x1": 534.84, - "r_y1": 120.29, - "r_x2": 534.84, - "r_y2": 106.57, - "r_x3": 472.27, - "r_y3": 106.57, + "r_x0": 121.67, + "r_y0": 220.0, + "r_x1": 168.67, + "r_y1": 220.0, + "r_x2": 168.67, + "r_y2": 204.33, + "r_x3": 121.67, + "r_y3": 204.33, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 3, @@ -1360,21 +1630,21 @@ "a": 255 }, "rect": { - "r_x0": 123.52, - "r_y0": 187.79, - "r_x1": 200.67, - "r_y1": 187.79, - "r_x2": 200.67, - "r_y2": 174.07, - "r_x3": 123.52, - "r_y3": 174.07, + "r_x0": 121.67, + "r_y0": 300.0, + "r_x1": 168.67, + "r_y1": 300.0, + "r_x2": 168.67, + "r_y2": 284.0, + "r_x3": 121.67, + "r_y3": 284.0, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 4, @@ -1385,21 +1655,21 @@ "a": 255 }, "rect": { - "r_x0": 241.65, - "r_y0": 187.79, - "r_x1": 310.71, - "r_y1": 187.79, - "r_x2": 310.71, - "r_y2": 174.07, - "r_x3": 241.65, - "r_y3": 174.07, + "r_x0": 232.67, + "r_y0": 126.33, + "r_x1": 364.0, + "r_y1": 126.33, + "r_x2": 364.0, + "r_y2": 105.67, + "r_x3": 232.67, + "r_y3": 105.67, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 5, @@ -1410,21 +1680,21 @@ "a": 255 }, "rect": { - "r_x0": 347.4, - "r_y0": 187.79, - "r_x1": 431.1, - "r_y1": 187.79, - "r_x2": 431.1, - "r_y2": 174.07, - "r_x3": 347.4, - "r_y3": 174.07, + "r_x0": 265.67, + "r_y0": 153.0, + "r_x1": 336.0, + "r_y1": 153.0, + "r_x2": 336.0, + "r_y2": 137.0, + "r_x3": 265.67, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 6, @@ -1435,21 +1705,21 @@ "a": 255 }, "rect": { - "r_x0": 491.4, - "r_y0": 187.79, - "r_x1": 515.79, - "r_y1": 187.79, - "r_x2": 515.79, - "r_y2": 174.07, - "r_x3": 491.4, - "r_y3": 174.07, + "r_x0": 247.0, + "r_y0": 204.33, + "r_x1": 349.67, + "r_y1": 204.33, + "r_x2": 349.67, + "r_y2": 188.33, + "r_x3": 247.0, + "r_y3": 188.33, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 7, @@ -1460,21 +1730,21 @@ "a": 255 }, "rect": { - "r_x0": 130.27, - "r_y0": 256.41, - "r_x1": 194.46, - "r_y1": 256.41, - "r_x2": 194.46, - "r_y2": 242.7, - "r_x3": 130.27, - "r_y3": 242.7, + "r_x0": 277.0, + "r_y0": 236.0, + "r_x1": 324.33, + "r_y1": 236.0, + "r_x2": 324.33, + "r_y2": 220.0, + "r_x3": 277.0, + "r_y3": 220.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 8, @@ -1485,21 +1755,21 @@ "a": 255 }, "rect": { - "r_x0": 373.27, - "r_y0": 256.41, - "r_x1": 406.59, - "r_y1": 256.41, - "r_x2": 406.59, - "r_y2": 242.7, - "r_x3": 373.27, - "r_y3": 242.7, + "r_x0": 247.0, + "r_y0": 284.0, + "r_x1": 349.67, + "r_y1": 284.0, + "r_x2": 349.67, + "r_y2": 268.0, + "r_x3": 247.0, + "r_y3": 268.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 9, @@ -1510,21 +1780,21 @@ "a": 255 }, "rect": { - "r_x0": 486.9, - "r_y0": 256.41, - "r_x1": 518.61, - "r_y1": 256.41, - "r_x2": 518.61, - "r_y2": 242.7, - "r_x3": 486.9, - "r_y3": 242.7, + "r_x0": 277.0, + "r_y0": 315.33, + "r_x1": 324.33, + "r_y1": 315.33, + "r_x2": 324.33, + "r_y2": 299.67, + "r_x3": 277.0, + "r_y3": 299.67, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 10, @@ -1535,21 +1805,21 @@ "a": 255 }, "rect": { - "r_x0": 116.77, - "r_y0": 329.54, - "r_x1": 207.76, - "r_y1": 329.54, - "r_x2": 207.76, - "r_y2": 315.82, - "r_x3": 116.77, - "r_y3": 315.82, + "r_x0": 406.33, + "r_y0": 121.67, + "r_x1": 518.33, + "r_y1": 121.67, + "r_x2": 518.33, + "r_y2": 105.67, + "r_x3": 406.33, + "r_y3": 105.67, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 11, @@ -1560,21 +1830,21 @@ "a": 255 }, "rect": { - "r_x0": 251.77, - "r_y0": 329.54, - "r_x1": 299.73, - "r_y1": 329.54, - "r_x2": 299.73, - "r_y2": 315.82, - "r_x3": 251.77, - "r_y3": 315.82, + "r_x0": 429.33, + "r_y0": 153.0, + "r_x1": 499.33, + "r_y1": 153.0, + "r_x2": 499.33, + "r_y2": 137.0, + "r_x3": 429.33, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 12, @@ -1585,35 +1855,110 @@ "a": 255 }, "rect": { - "r_x0": 484.65, - "r_y0": 329.54, - "r_x1": 522.85, - "r_y1": 329.54, - "r_x2": 522.85, - "r_y2": 315.82, - "r_x3": 484.65, - "r_y3": 315.82, + "r_x0": 408.33, + "r_y0": 204.33, + "r_x1": 514.0, + "r_y1": 204.33, + "r_x2": 514.0, + "r_y2": 188.33, + "r_x3": 408.33, + "r_y3": 188.33, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 440.67, + "r_y0": 236.0, + "r_x1": 487.67, + "r_y1": 236.0, + "r_x2": 487.67, + "r_y2": 220.0, + "r_x3": 440.67, + "r_y3": 220.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 408.33, + "r_y0": 284.0, + "r_x1": 514.0, + "r_y1": 284.0, + "r_x2": 514.0, + "r_y2": 268.0, + "r_x3": 408.33, + "r_y3": 268.0, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 440.67, + "r_y0": 315.33, + "r_x1": 487.67, + "r_y1": 315.33, + "r_x2": 487.67, + "r_y2": 299.67, + "r_x3": 440.67, + "r_y3": 299.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "children": [ { - "id": 14, + "id": 1, "label": "text", "bbox": { - "l": 245.02, - "t": 106.57, - "r": 307.59, - "b": 120.29, + "l": 97.33, + "t": 105.67, + "r": 190.0, + "b": 126.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 89.0, "cells": [ { "index": 0, @@ -1624,36 +1969,36 @@ "a": 255 }, "rect": { - "r_x0": 245.02, - "r_y0": 120.29, - "r_x1": 307.59, - "r_y1": 120.29, - "r_x2": 307.59, - "r_y2": 106.57, - "r_x3": 245.02, - "r_y3": 106.57, + "r_x0": 97.33, + "r_y0": 126.33, + "r_x1": 190.0, + "r_y1": 126.33, + "r_x2": 190.0, + "r_y2": 105.67, + "r_x3": 97.33, + "r_y3": 105.67, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 89.0, + "from_ocr": true } ], "children": [] }, { - "id": 15, + "id": 2, "label": "text", "bbox": { - "l": 358.65, - "t": 106.57, - "r": 421.22, - "b": 120.29, + "l": 112.0, + "t": 137.0, + "r": 182.33, + "b": 157.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 92.0, "cells": [ { "index": 1, @@ -1664,36 +2009,36 @@ "a": 255 }, "rect": { - "r_x0": 358.65, - "r_y0": 120.29, - "r_x1": 421.22, - "r_y1": 120.29, - "r_x2": 421.22, - "r_y2": 106.57, - "r_x3": 358.65, - "r_y3": 106.57, + "r_x0": 112.0, + "r_y0": 157.67, + "r_x1": 182.33, + "r_y1": 157.67, + "r_x2": 182.33, + "r_y2": 137.0, + "r_x3": 112.0, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true } ], "children": [] }, { - "id": 16, + "id": 3, "label": "text", "bbox": { - "l": 472.27, - "t": 106.57, - "r": 534.84, - "b": 120.29, + "l": 121.67, + "t": 204.33, + "r": 168.67, + "b": 220.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 2, @@ -1704,36 +2049,36 @@ "a": 255 }, "rect": { - "r_x0": 472.27, - "r_y0": 120.29, - "r_x1": 534.84, - "r_y1": 120.29, - "r_x2": 534.84, - "r_y2": 106.57, - "r_x3": 472.27, - "r_y3": 106.57, + "r_x0": 121.67, + "r_y0": 220.0, + "r_x1": 168.67, + "r_y1": 220.0, + "r_x2": 168.67, + "r_y2": 204.33, + "r_x3": 121.67, + "r_y3": 204.33, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 17, + "id": 4, "label": "text", "bbox": { - "l": 123.52, - "t": 174.07, - "r": 200.67, - "b": 187.79, + "l": 121.67, + "t": 284.0, + "r": 168.67, + "b": 300.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 3, @@ -1744,36 +2089,36 @@ "a": 255 }, "rect": { - "r_x0": 123.52, - "r_y0": 187.79, - "r_x1": 200.67, - "r_y1": 187.79, - "r_x2": 200.67, - "r_y2": 174.07, - "r_x3": 123.52, - "r_y3": 174.07, + "r_x0": 121.67, + "r_y0": 300.0, + "r_x1": 168.67, + "r_y1": 300.0, + "r_x2": 168.67, + "r_y2": 284.0, + "r_x3": 121.67, + "r_y3": 284.0, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 18, + "id": 5, "label": "text", "bbox": { - "l": 241.65, - "t": 174.07, - "r": 310.71, - "b": 187.79, + "l": 232.67, + "t": 105.67, + "r": 364.0, + "b": 126.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 92.0, "cells": [ { "index": 4, @@ -1784,36 +2129,36 @@ "a": 255 }, "rect": { - "r_x0": 241.65, - "r_y0": 187.79, - "r_x1": 310.71, - "r_y1": 187.79, - "r_x2": 310.71, - "r_y2": 174.07, - "r_x3": 241.65, - "r_y3": 174.07, + "r_x0": 232.67, + "r_y0": 126.33, + "r_x1": 364.0, + "r_y1": 126.33, + "r_x2": 364.0, + "r_y2": 105.67, + "r_x3": 232.67, + "r_y3": 105.67, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true } ], "children": [] }, { - "id": 19, + "id": 6, "label": "text", "bbox": { - "l": 347.4, - "t": 174.07, - "r": 431.1, - "b": 187.79, + "l": 265.67, + "t": 137.0, + "r": 336.0, + "b": 153.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 5, @@ -1824,36 +2169,36 @@ "a": 255 }, "rect": { - "r_x0": 347.4, - "r_y0": 187.79, - "r_x1": 431.1, - "r_y1": 187.79, - "r_x2": 431.1, - "r_y2": 174.07, - "r_x3": 347.4, - "r_y3": 174.07, + "r_x0": 265.67, + "r_y0": 153.0, + "r_x1": 336.0, + "r_y1": 153.0, + "r_x2": 336.0, + "r_y2": 137.0, + "r_x3": 265.67, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 20, + "id": 7, "label": "text", "bbox": { - "l": 491.4, - "t": 174.07, - "r": 515.79, - "b": 187.79, + "l": 247.0, + "t": 188.33, + "r": 349.67, + "b": 204.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 6, @@ -1864,36 +2209,36 @@ "a": 255 }, "rect": { - "r_x0": 491.4, - "r_y0": 187.79, - "r_x1": 515.79, - "r_y1": 187.79, - "r_x2": 515.79, - "r_y2": 174.07, - "r_x3": 491.4, - "r_y3": 174.07, + "r_x0": 247.0, + "r_y0": 204.33, + "r_x1": 349.67, + "r_y1": 204.33, + "r_x2": 349.67, + "r_y2": 188.33, + "r_x3": 247.0, + "r_y3": 188.33, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 21, + "id": 8, "label": "text", "bbox": { - "l": 130.27, - "t": 242.7, - "r": 194.46, - "b": 256.41, + "l": 277.0, + "t": 220.0, + "r": 324.33, + "b": 236.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 7, @@ -1904,36 +2249,36 @@ "a": 255 }, "rect": { - "r_x0": 130.27, - "r_y0": 256.41, - "r_x1": 194.46, - "r_y1": 256.41, - "r_x2": 194.46, - "r_y2": 242.7, - "r_x3": 130.27, - "r_y3": 242.7, + "r_x0": 277.0, + "r_y0": 236.0, + "r_x1": 324.33, + "r_y1": 236.0, + "r_x2": 324.33, + "r_y2": 220.0, + "r_x3": 277.0, + "r_y3": 220.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 22, + "id": 9, "label": "text", "bbox": { - "l": 373.27, - "t": 242.7, - "r": 406.59, - "b": 256.41, + "l": 247.0, + "t": 268.0, + "r": 349.67, + "b": 284.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 92.0, "cells": [ { "index": 8, @@ -1944,36 +2289,36 @@ "a": 255 }, "rect": { - "r_x0": 373.27, - "r_y0": 256.41, - "r_x1": 406.59, - "r_y1": 256.41, - "r_x2": 406.59, - "r_y2": 242.7, - "r_x3": 373.27, - "r_y3": 242.7, + "r_x0": 247.0, + "r_y0": 284.0, + "r_x1": 349.67, + "r_y1": 284.0, + "r_x2": 349.67, + "r_y2": 268.0, + "r_x3": 247.0, + "r_y3": 268.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true } ], "children": [] }, { - "id": 23, + "id": 10, "label": "text", "bbox": { - "l": 486.9, - "t": 242.7, - "r": 518.61, - "b": 256.41, + "l": 277.0, + "t": 299.67, + "r": 324.33, + "b": 315.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 9, @@ -1984,36 +2329,36 @@ "a": 255 }, "rect": { - "r_x0": 486.9, - "r_y0": 256.41, - "r_x1": 518.61, - "r_y1": 256.41, - "r_x2": 518.61, - "r_y2": 242.7, - "r_x3": 486.9, - "r_y3": 242.7, + "r_x0": 277.0, + "r_y0": 315.33, + "r_x1": 324.33, + "r_y1": 315.33, + "r_x2": 324.33, + "r_y2": 299.67, + "r_x3": 277.0, + "r_y3": 299.67, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 24, + "id": 11, "label": "text", "bbox": { - "l": 116.77, - "t": 315.82, - "r": 207.76, - "b": 329.54, + "l": 406.33, + "t": 105.67, + "r": 518.33, + "b": 121.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 10, @@ -2024,36 +2369,36 @@ "a": 255 }, "rect": { - "r_x0": 116.77, - "r_y0": 329.54, - "r_x1": 207.76, - "r_y1": 329.54, - "r_x2": 207.76, - "r_y2": 315.82, - "r_x3": 116.77, - "r_y3": 315.82, + "r_x0": 406.33, + "r_y0": 121.67, + "r_x1": 518.33, + "r_y1": 121.67, + "r_x2": 518.33, + "r_y2": 105.67, + "r_x3": 406.33, + "r_y3": 105.67, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 25, + "id": 12, "label": "text", "bbox": { - "l": 251.77, - "t": 315.82, - "r": 299.73, - "b": 329.54, + "l": 429.33, + "t": 137.0, + "r": 499.33, + "b": 153.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 11, @@ -2064,36 +2409,36 @@ "a": 255 }, "rect": { - "r_x0": 251.77, - "r_y0": 329.54, - "r_x1": 299.73, - "r_y1": 329.54, - "r_x2": 299.73, - "r_y2": 315.82, - "r_x3": 251.77, - "r_y3": 315.82, + "r_x0": 429.33, + "r_y0": 153.0, + "r_x1": 499.33, + "r_y1": 153.0, + "r_x2": 499.33, + "r_y2": 137.0, + "r_x3": 429.33, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 26, + "id": 13, "label": "text", "bbox": { - "l": 484.65, - "t": 315.82, - "r": 522.85, - "b": 329.54, + "l": 408.33, + "t": 188.33, + "r": 514.0, + "b": 204.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 12, @@ -2104,21 +2449,141 @@ "a": 255 }, "rect": { - "r_x0": 484.65, - "r_y0": 329.54, - "r_x1": 522.85, - "r_y1": 329.54, - "r_x2": 522.85, - "r_y2": 315.82, - "r_x3": 484.65, - "r_y3": 315.82, + "r_x0": 408.33, + "r_y0": 204.33, + "r_x1": 514.0, + "r_y1": 204.33, + "r_x2": 514.0, + "r_y2": 188.33, + "r_x3": 408.33, + "r_y3": 188.33, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 14, + "label": "text", + "bbox": { + "l": 440.67, + "t": 220.0, + "r": 487.67, + "b": 236.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 440.67, + "r_y0": 236.0, + "r_x1": 487.67, + "r_y1": 236.0, + "r_x2": 487.67, + "r_y2": 220.0, + "r_x3": 440.67, + "r_y3": 220.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 15, + "label": "text", + "bbox": { + "l": 408.33, + "t": 268.0, + "r": 514.0, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 408.33, + "r_y0": 284.0, + "r_x1": 514.0, + "r_y1": 284.0, + "r_x2": 514.0, + "r_y2": 268.0, + "r_x3": 408.33, + "r_y3": 268.0, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 16, + "label": "text", + "bbox": { + "l": 440.67, + "t": 299.67, + "r": 487.67, + "b": 315.33, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 440.67, + "r_y0": 315.33, + "r_x1": 487.67, + "r_y1": 315.33, + "r_x2": 487.67, + "r_y2": 299.67, + "r_x3": 440.67, + "r_y3": 299.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "children": [] @@ -2127,93 +2592,47 @@ }, "text": null, "otsl_seq": [ - "ecel", "ched", "ched", "ched", "nl", - "rhed", "fcel", "fcel", "fcel", "nl", - "rhed", - "ecel", "fcel", "fcel", - "nl", - "rhed", - "fcel", - "ecel", "fcel", "nl" ], - "num_rows": 4, - "num_cols": 4, + "num_rows": 3, + "num_cols": 3, "table_cells": [ { "bbox": { - "l": 245.02, - "t": 106.57, - "r": 307.59, - "b": 120.29, + "l": 97.33, + "t": 105.67, + "r": 190.0, + "b": 126.33, "coord_origin": "TOPLEFT" }, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "Column 0", + "start_col_offset_idx": 0, + "end_col_offset_idx": 1, + "text": "Vertically merged", "column_header": true, "row_header": false, "row_section": false }, { "bbox": { - "l": 358.65, - "t": 106.57, - "r": 421.22, - "b": 120.29, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "Column 1", - "column_header": true, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 472.27, - "t": 106.57, - "r": 534.84, - "b": 120.29, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "Column 2", - "column_header": true, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 123.52, - "t": 174.07, - "r": 200.67, - "b": 187.79, + "l": 121.67, + "t": 204.33, + "r": 168.67, + "b": 220.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -2222,74 +2641,17 @@ "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, - "text": "this is row 0", - "column_header": false, - "row_header": true, - "row_section": false - }, - { - "bbox": { - "l": 241.65, - "t": 174.07, - "r": 310.71, - "b": 187.79, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "some cells", + "text": "value", "column_header": false, "row_header": false, "row_section": false }, { "bbox": { - "l": 347.4, - "t": 174.07, - "r": 431.1, - "b": 187.79, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "have content", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 491.4, - "t": 174.07, - "r": 515.79, - "b": 187.79, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "and", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 130.27, - "t": 242.7, - "r": 194.46, - "b": 256.41, + "l": 121.67, + "t": 284.0, + "r": 168.67, + "b": 300.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -2298,17 +2660,112 @@ "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, - "text": "and row 1", + "text": "value", "column_header": false, - "row_header": true, + "row_header": false, "row_section": false }, { "bbox": { - "l": 373.27, - "t": 242.7, - "r": 406.59, - "b": 256.41, + "l": 232.67, + "t": 105.67, + "r": 364.0, + "b": 126.33, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Other merged column", + "column_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 247.0, + "t": 188.33, + "r": 349.67, + "b": 204.33, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Some other value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 247.0, + "t": 268.0, + "r": 349.67, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 2, + "end_row_offset_idx": 3, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Some other value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 406.33, + "t": 105.67, + "r": 518.33, + "b": 121.67, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another column", + "column_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 408.33, + "t": 188.33, + "r": 514.0, + "b": 204.33, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 408.33, + "t": 268.0, + "r": 514.0, + "b": 284.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -2317,83 +2774,7 @@ "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, - "text": "other", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 486.9, - "t": 242.7, - "r": 518.61, - "b": 256.41, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "have", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 116.77, - "t": 315.82, - "r": 207.76, - "b": 329.54, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "and last row 2", - "column_header": false, - "row_header": true, - "row_section": false - }, - { - "bbox": { - "l": 251.77, - "t": 315.82, - "r": 299.73, - "b": 329.54, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "nothing", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 484.65, - "t": 315.82, - "r": 522.85, - "b": 329.54, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "inside", + "text": "Yet another value", "column_header": false, "row_header": false, "row_section": false @@ -2416,13 +2797,13 @@ "id": 0, "label": "table", "bbox": { - "l": 103.33, - "t": 75.14, - "r": 560.95, - "b": 360.93, + "l": 69.05, + "t": 87.65, + "r": 551.1, + "b": 334.58, "coord_origin": "TOPLEFT" }, - "confidence": 0.968, + "confidence": 0.979, "cells": [ { "index": 0, @@ -2433,21 +2814,21 @@ "a": 255 }, "rect": { - "r_x0": 245.02, - "r_y0": 120.29, - "r_x1": 307.59, - "r_y1": 120.29, - "r_x2": 307.59, - "r_y2": 106.57, - "r_x3": 245.02, - "r_y3": 106.57, + "r_x0": 97.33, + "r_y0": 126.33, + "r_x1": 190.0, + "r_y1": 126.33, + "r_x2": 190.0, + "r_y2": 105.67, + "r_x3": 97.33, + "r_y3": 105.67, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 89.0, + "from_ocr": true }, { "index": 1, @@ -2458,21 +2839,21 @@ "a": 255 }, "rect": { - "r_x0": 358.65, - "r_y0": 120.29, - "r_x1": 421.22, - "r_y1": 120.29, - "r_x2": 421.22, - "r_y2": 106.57, - "r_x3": 358.65, - "r_y3": 106.57, + "r_x0": 112.0, + "r_y0": 157.67, + "r_x1": 182.33, + "r_y1": 157.67, + "r_x2": 182.33, + "r_y2": 137.0, + "r_x3": 112.0, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 2, @@ -2483,21 +2864,21 @@ "a": 255 }, "rect": { - "r_x0": 472.27, - "r_y0": 120.29, - "r_x1": 534.84, - "r_y1": 120.29, - "r_x2": 534.84, - "r_y2": 106.57, - "r_x3": 472.27, - "r_y3": 106.57, + "r_x0": 121.67, + "r_y0": 220.0, + "r_x1": 168.67, + "r_y1": 220.0, + "r_x2": 168.67, + "r_y2": 204.33, + "r_x3": 121.67, + "r_y3": 204.33, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 3, @@ -2508,21 +2889,21 @@ "a": 255 }, "rect": { - "r_x0": 123.52, - "r_y0": 187.79, - "r_x1": 200.67, - "r_y1": 187.79, - "r_x2": 200.67, - "r_y2": 174.07, - "r_x3": 123.52, - "r_y3": 174.07, + "r_x0": 121.67, + "r_y0": 300.0, + "r_x1": 168.67, + "r_y1": 300.0, + "r_x2": 168.67, + "r_y2": 284.0, + "r_x3": 121.67, + "r_y3": 284.0, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 4, @@ -2533,21 +2914,21 @@ "a": 255 }, "rect": { - "r_x0": 241.65, - "r_y0": 187.79, - "r_x1": 310.71, - "r_y1": 187.79, - "r_x2": 310.71, - "r_y2": 174.07, - "r_x3": 241.65, - "r_y3": 174.07, + "r_x0": 232.67, + "r_y0": 126.33, + "r_x1": 364.0, + "r_y1": 126.33, + "r_x2": 364.0, + "r_y2": 105.67, + "r_x3": 232.67, + "r_y3": 105.67, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 5, @@ -2558,21 +2939,21 @@ "a": 255 }, "rect": { - "r_x0": 347.4, - "r_y0": 187.79, - "r_x1": 431.1, - "r_y1": 187.79, - "r_x2": 431.1, - "r_y2": 174.07, - "r_x3": 347.4, - "r_y3": 174.07, + "r_x0": 265.67, + "r_y0": 153.0, + "r_x1": 336.0, + "r_y1": 153.0, + "r_x2": 336.0, + "r_y2": 137.0, + "r_x3": 265.67, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 6, @@ -2583,21 +2964,21 @@ "a": 255 }, "rect": { - "r_x0": 491.4, - "r_y0": 187.79, - "r_x1": 515.79, - "r_y1": 187.79, - "r_x2": 515.79, - "r_y2": 174.07, - "r_x3": 491.4, - "r_y3": 174.07, + "r_x0": 247.0, + "r_y0": 204.33, + "r_x1": 349.67, + "r_y1": 204.33, + "r_x2": 349.67, + "r_y2": 188.33, + "r_x3": 247.0, + "r_y3": 188.33, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 7, @@ -2608,21 +2989,21 @@ "a": 255 }, "rect": { - "r_x0": 130.27, - "r_y0": 256.41, - "r_x1": 194.46, - "r_y1": 256.41, - "r_x2": 194.46, - "r_y2": 242.7, - "r_x3": 130.27, - "r_y3": 242.7, + "r_x0": 277.0, + "r_y0": 236.0, + "r_x1": 324.33, + "r_y1": 236.0, + "r_x2": 324.33, + "r_y2": 220.0, + "r_x3": 277.0, + "r_y3": 220.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 8, @@ -2633,21 +3014,21 @@ "a": 255 }, "rect": { - "r_x0": 373.27, - "r_y0": 256.41, - "r_x1": 406.59, - "r_y1": 256.41, - "r_x2": 406.59, - "r_y2": 242.7, - "r_x3": 373.27, - "r_y3": 242.7, + "r_x0": 247.0, + "r_y0": 284.0, + "r_x1": 349.67, + "r_y1": 284.0, + "r_x2": 349.67, + "r_y2": 268.0, + "r_x3": 247.0, + "r_y3": 268.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 9, @@ -2658,21 +3039,21 @@ "a": 255 }, "rect": { - "r_x0": 486.9, - "r_y0": 256.41, - "r_x1": 518.61, - "r_y1": 256.41, - "r_x2": 518.61, - "r_y2": 242.7, - "r_x3": 486.9, - "r_y3": 242.7, + "r_x0": 277.0, + "r_y0": 315.33, + "r_x1": 324.33, + "r_y1": 315.33, + "r_x2": 324.33, + "r_y2": 299.67, + "r_x3": 277.0, + "r_y3": 299.67, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 10, @@ -2683,21 +3064,21 @@ "a": 255 }, "rect": { - "r_x0": 116.77, - "r_y0": 329.54, - "r_x1": 207.76, - "r_y1": 329.54, - "r_x2": 207.76, - "r_y2": 315.82, - "r_x3": 116.77, - "r_y3": 315.82, + "r_x0": 406.33, + "r_y0": 121.67, + "r_x1": 518.33, + "r_y1": 121.67, + "r_x2": 518.33, + "r_y2": 105.67, + "r_x3": 406.33, + "r_y3": 105.67, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 11, @@ -2708,21 +3089,21 @@ "a": 255 }, "rect": { - "r_x0": 251.77, - "r_y0": 329.54, - "r_x1": 299.73, - "r_y1": 329.54, - "r_x2": 299.73, - "r_y2": 315.82, - "r_x3": 251.77, - "r_y3": 315.82, + "r_x0": 429.33, + "r_y0": 153.0, + "r_x1": 499.33, + "r_y1": 153.0, + "r_x2": 499.33, + "r_y2": 137.0, + "r_x3": 429.33, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 12, @@ -2733,35 +3114,110 @@ "a": 255 }, "rect": { - "r_x0": 484.65, - "r_y0": 329.54, - "r_x1": 522.85, - "r_y1": 329.54, - "r_x2": 522.85, - "r_y2": 315.82, - "r_x3": 484.65, - "r_y3": 315.82, + "r_x0": 408.33, + "r_y0": 204.33, + "r_x1": 514.0, + "r_y1": 204.33, + "r_x2": 514.0, + "r_y2": 188.33, + "r_x3": 408.33, + "r_y3": 188.33, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 440.67, + "r_y0": 236.0, + "r_x1": 487.67, + "r_y1": 236.0, + "r_x2": 487.67, + "r_y2": 220.0, + "r_x3": 440.67, + "r_y3": 220.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 408.33, + "r_y0": 284.0, + "r_x1": 514.0, + "r_y1": 284.0, + "r_x2": 514.0, + "r_y2": 268.0, + "r_x3": 408.33, + "r_y3": 268.0, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 440.67, + "r_y0": 315.33, + "r_x1": 487.67, + "r_y1": 315.33, + "r_x2": 487.67, + "r_y2": 299.67, + "r_x3": 440.67, + "r_y3": 299.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "children": [ { - "id": 14, + "id": 1, "label": "text", "bbox": { - "l": 245.02, - "t": 106.57, - "r": 307.59, - "b": 120.29, + "l": 97.33, + "t": 105.67, + "r": 190.0, + "b": 126.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 89.0, "cells": [ { "index": 0, @@ -2772,36 +3228,36 @@ "a": 255 }, "rect": { - "r_x0": 245.02, - "r_y0": 120.29, - "r_x1": 307.59, - "r_y1": 120.29, - "r_x2": 307.59, - "r_y2": 106.57, - "r_x3": 245.02, - "r_y3": 106.57, + "r_x0": 97.33, + "r_y0": 126.33, + "r_x1": 190.0, + "r_y1": 126.33, + "r_x2": 190.0, + "r_y2": 105.67, + "r_x3": 97.33, + "r_y3": 105.67, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 89.0, + "from_ocr": true } ], "children": [] }, { - "id": 15, + "id": 2, "label": "text", "bbox": { - "l": 358.65, - "t": 106.57, - "r": 421.22, - "b": 120.29, + "l": 112.0, + "t": 137.0, + "r": 182.33, + "b": 157.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 92.0, "cells": [ { "index": 1, @@ -2812,36 +3268,36 @@ "a": 255 }, "rect": { - "r_x0": 358.65, - "r_y0": 120.29, - "r_x1": 421.22, - "r_y1": 120.29, - "r_x2": 421.22, - "r_y2": 106.57, - "r_x3": 358.65, - "r_y3": 106.57, + "r_x0": 112.0, + "r_y0": 157.67, + "r_x1": 182.33, + "r_y1": 157.67, + "r_x2": 182.33, + "r_y2": 137.0, + "r_x3": 112.0, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true } ], "children": [] }, { - "id": 16, + "id": 3, "label": "text", "bbox": { - "l": 472.27, - "t": 106.57, - "r": 534.84, - "b": 120.29, + "l": 121.67, + "t": 204.33, + "r": 168.67, + "b": 220.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 2, @@ -2852,36 +3308,36 @@ "a": 255 }, "rect": { - "r_x0": 472.27, - "r_y0": 120.29, - "r_x1": 534.84, - "r_y1": 120.29, - "r_x2": 534.84, - "r_y2": 106.57, - "r_x3": 472.27, - "r_y3": 106.57, + "r_x0": 121.67, + "r_y0": 220.0, + "r_x1": 168.67, + "r_y1": 220.0, + "r_x2": 168.67, + "r_y2": 204.33, + "r_x3": 121.67, + "r_y3": 204.33, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 17, + "id": 4, "label": "text", "bbox": { - "l": 123.52, - "t": 174.07, - "r": 200.67, - "b": 187.79, + "l": 121.67, + "t": 284.0, + "r": 168.67, + "b": 300.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 3, @@ -2892,36 +3348,36 @@ "a": 255 }, "rect": { - "r_x0": 123.52, - "r_y0": 187.79, - "r_x1": 200.67, - "r_y1": 187.79, - "r_x2": 200.67, - "r_y2": 174.07, - "r_x3": 123.52, - "r_y3": 174.07, + "r_x0": 121.67, + "r_y0": 300.0, + "r_x1": 168.67, + "r_y1": 300.0, + "r_x2": 168.67, + "r_y2": 284.0, + "r_x3": 121.67, + "r_y3": 284.0, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 18, + "id": 5, "label": "text", "bbox": { - "l": 241.65, - "t": 174.07, - "r": 310.71, - "b": 187.79, + "l": 232.67, + "t": 105.67, + "r": 364.0, + "b": 126.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 92.0, "cells": [ { "index": 4, @@ -2932,36 +3388,36 @@ "a": 255 }, "rect": { - "r_x0": 241.65, - "r_y0": 187.79, - "r_x1": 310.71, - "r_y1": 187.79, - "r_x2": 310.71, - "r_y2": 174.07, - "r_x3": 241.65, - "r_y3": 174.07, + "r_x0": 232.67, + "r_y0": 126.33, + "r_x1": 364.0, + "r_y1": 126.33, + "r_x2": 364.0, + "r_y2": 105.67, + "r_x3": 232.67, + "r_y3": 105.67, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true } ], "children": [] }, { - "id": 19, + "id": 6, "label": "text", "bbox": { - "l": 347.4, - "t": 174.07, - "r": 431.1, - "b": 187.79, + "l": 265.67, + "t": 137.0, + "r": 336.0, + "b": 153.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 5, @@ -2972,36 +3428,36 @@ "a": 255 }, "rect": { - "r_x0": 347.4, - "r_y0": 187.79, - "r_x1": 431.1, - "r_y1": 187.79, - "r_x2": 431.1, - "r_y2": 174.07, - "r_x3": 347.4, - "r_y3": 174.07, + "r_x0": 265.67, + "r_y0": 153.0, + "r_x1": 336.0, + "r_y1": 153.0, + "r_x2": 336.0, + "r_y2": 137.0, + "r_x3": 265.67, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 20, + "id": 7, "label": "text", "bbox": { - "l": 491.4, - "t": 174.07, - "r": 515.79, - "b": 187.79, + "l": 247.0, + "t": 188.33, + "r": 349.67, + "b": 204.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 6, @@ -3012,36 +3468,36 @@ "a": 255 }, "rect": { - "r_x0": 491.4, - "r_y0": 187.79, - "r_x1": 515.79, - "r_y1": 187.79, - "r_x2": 515.79, - "r_y2": 174.07, - "r_x3": 491.4, - "r_y3": 174.07, + "r_x0": 247.0, + "r_y0": 204.33, + "r_x1": 349.67, + "r_y1": 204.33, + "r_x2": 349.67, + "r_y2": 188.33, + "r_x3": 247.0, + "r_y3": 188.33, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 21, + "id": 8, "label": "text", "bbox": { - "l": 130.27, - "t": 242.7, - "r": 194.46, - "b": 256.41, + "l": 277.0, + "t": 220.0, + "r": 324.33, + "b": 236.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 7, @@ -3052,36 +3508,36 @@ "a": 255 }, "rect": { - "r_x0": 130.27, - "r_y0": 256.41, - "r_x1": 194.46, - "r_y1": 256.41, - "r_x2": 194.46, - "r_y2": 242.7, - "r_x3": 130.27, - "r_y3": 242.7, + "r_x0": 277.0, + "r_y0": 236.0, + "r_x1": 324.33, + "r_y1": 236.0, + "r_x2": 324.33, + "r_y2": 220.0, + "r_x3": 277.0, + "r_y3": 220.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 22, + "id": 9, "label": "text", "bbox": { - "l": 373.27, - "t": 242.7, - "r": 406.59, - "b": 256.41, + "l": 247.0, + "t": 268.0, + "r": 349.67, + "b": 284.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 92.0, "cells": [ { "index": 8, @@ -3092,36 +3548,36 @@ "a": 255 }, "rect": { - "r_x0": 373.27, - "r_y0": 256.41, - "r_x1": 406.59, - "r_y1": 256.41, - "r_x2": 406.59, - "r_y2": 242.7, - "r_x3": 373.27, - "r_y3": 242.7, + "r_x0": 247.0, + "r_y0": 284.0, + "r_x1": 349.67, + "r_y1": 284.0, + "r_x2": 349.67, + "r_y2": 268.0, + "r_x3": 247.0, + "r_y3": 268.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true } ], "children": [] }, { - "id": 23, + "id": 10, "label": "text", "bbox": { - "l": 486.9, - "t": 242.7, - "r": 518.61, - "b": 256.41, + "l": 277.0, + "t": 299.67, + "r": 324.33, + "b": 315.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 9, @@ -3132,36 +3588,36 @@ "a": 255 }, "rect": { - "r_x0": 486.9, - "r_y0": 256.41, - "r_x1": 518.61, - "r_y1": 256.41, - "r_x2": 518.61, - "r_y2": 242.7, - "r_x3": 486.9, - "r_y3": 242.7, + "r_x0": 277.0, + "r_y0": 315.33, + "r_x1": 324.33, + "r_y1": 315.33, + "r_x2": 324.33, + "r_y2": 299.67, + "r_x3": 277.0, + "r_y3": 299.67, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 24, + "id": 11, "label": "text", "bbox": { - "l": 116.77, - "t": 315.82, - "r": 207.76, - "b": 329.54, + "l": 406.33, + "t": 105.67, + "r": 518.33, + "b": 121.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 10, @@ -3172,36 +3628,36 @@ "a": 255 }, "rect": { - "r_x0": 116.77, - "r_y0": 329.54, - "r_x1": 207.76, - "r_y1": 329.54, - "r_x2": 207.76, - "r_y2": 315.82, - "r_x3": 116.77, - "r_y3": 315.82, + "r_x0": 406.33, + "r_y0": 121.67, + "r_x1": 518.33, + "r_y1": 121.67, + "r_x2": 518.33, + "r_y2": 105.67, + "r_x3": 406.33, + "r_y3": 105.67, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 25, + "id": 12, "label": "text", "bbox": { - "l": 251.77, - "t": 315.82, - "r": 299.73, - "b": 329.54, + "l": 429.33, + "t": 137.0, + "r": 499.33, + "b": 153.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 11, @@ -3212,36 +3668,36 @@ "a": 255 }, "rect": { - "r_x0": 251.77, - "r_y0": 329.54, - "r_x1": 299.73, - "r_y1": 329.54, - "r_x2": 299.73, - "r_y2": 315.82, - "r_x3": 251.77, - "r_y3": 315.82, + "r_x0": 429.33, + "r_y0": 153.0, + "r_x1": 499.33, + "r_y1": 153.0, + "r_x2": 499.33, + "r_y2": 137.0, + "r_x3": 429.33, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 26, + "id": 13, "label": "text", "bbox": { - "l": 484.65, - "t": 315.82, - "r": 522.85, - "b": 329.54, + "l": 408.33, + "t": 188.33, + "r": 514.0, + "b": 204.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 12, @@ -3252,21 +3708,141 @@ "a": 255 }, "rect": { - "r_x0": 484.65, - "r_y0": 329.54, - "r_x1": 522.85, - "r_y1": 329.54, - "r_x2": 522.85, - "r_y2": 315.82, - "r_x3": 484.65, - "r_y3": 315.82, + "r_x0": 408.33, + "r_y0": 204.33, + "r_x1": 514.0, + "r_y1": 204.33, + "r_x2": 514.0, + "r_y2": 188.33, + "r_x3": 408.33, + "r_y3": 188.33, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 14, + "label": "text", + "bbox": { + "l": 440.67, + "t": 220.0, + "r": 487.67, + "b": 236.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 440.67, + "r_y0": 236.0, + "r_x1": 487.67, + "r_y1": 236.0, + "r_x2": 487.67, + "r_y2": 220.0, + "r_x3": 440.67, + "r_y3": 220.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 15, + "label": "text", + "bbox": { + "l": 408.33, + "t": 268.0, + "r": 514.0, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 408.33, + "r_y0": 284.0, + "r_x1": 514.0, + "r_y1": 284.0, + "r_x2": 514.0, + "r_y2": 268.0, + "r_x3": 408.33, + "r_y3": 268.0, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 16, + "label": "text", + "bbox": { + "l": 440.67, + "t": 299.67, + "r": 487.67, + "b": 315.33, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 440.67, + "r_y0": 315.33, + "r_x1": 487.67, + "r_y1": 315.33, + "r_x2": 487.67, + "r_y2": 299.67, + "r_x3": 440.67, + "r_y3": 299.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "children": [] @@ -3275,93 +3851,47 @@ }, "text": null, "otsl_seq": [ - "ecel", "ched", "ched", "ched", "nl", - "rhed", "fcel", "fcel", "fcel", "nl", - "rhed", - "ecel", "fcel", "fcel", - "nl", - "rhed", - "fcel", - "ecel", "fcel", "nl" ], - "num_rows": 4, - "num_cols": 4, + "num_rows": 3, + "num_cols": 3, "table_cells": [ { "bbox": { - "l": 245.02, - "t": 106.57, - "r": 307.59, - "b": 120.29, + "l": 97.33, + "t": 105.67, + "r": 190.0, + "b": 126.33, "coord_origin": "TOPLEFT" }, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "Column 0", + "start_col_offset_idx": 0, + "end_col_offset_idx": 1, + "text": "Vertically merged", "column_header": true, "row_header": false, "row_section": false }, { "bbox": { - "l": 358.65, - "t": 106.57, - "r": 421.22, - "b": 120.29, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "Column 1", - "column_header": true, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 472.27, - "t": 106.57, - "r": 534.84, - "b": 120.29, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "Column 2", - "column_header": true, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 123.52, - "t": 174.07, - "r": 200.67, - "b": 187.79, + "l": 121.67, + "t": 204.33, + "r": 168.67, + "b": 220.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -3370,74 +3900,17 @@ "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, - "text": "this is row 0", - "column_header": false, - "row_header": true, - "row_section": false - }, - { - "bbox": { - "l": 241.65, - "t": 174.07, - "r": 310.71, - "b": 187.79, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "some cells", + "text": "value", "column_header": false, "row_header": false, "row_section": false }, { "bbox": { - "l": 347.4, - "t": 174.07, - "r": 431.1, - "b": 187.79, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "have content", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 491.4, - "t": 174.07, - "r": 515.79, - "b": 187.79, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "and", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 130.27, - "t": 242.7, - "r": 194.46, - "b": 256.41, + "l": 121.67, + "t": 284.0, + "r": 168.67, + "b": 300.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -3446,17 +3919,112 @@ "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, - "text": "and row 1", + "text": "value", "column_header": false, - "row_header": true, + "row_header": false, "row_section": false }, { "bbox": { - "l": 373.27, - "t": 242.7, - "r": 406.59, - "b": 256.41, + "l": 232.67, + "t": 105.67, + "r": 364.0, + "b": 126.33, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Other merged column", + "column_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 247.0, + "t": 188.33, + "r": 349.67, + "b": 204.33, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Some other value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 247.0, + "t": 268.0, + "r": 349.67, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 2, + "end_row_offset_idx": 3, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Some other value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 406.33, + "t": 105.67, + "r": 518.33, + "b": 121.67, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another column", + "column_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 408.33, + "t": 188.33, + "r": 514.0, + "b": 204.33, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 408.33, + "t": 268.0, + "r": 514.0, + "b": 284.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -3465,83 +4033,7 @@ "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, - "text": "other", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 486.9, - "t": 242.7, - "r": 518.61, - "b": 256.41, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "have", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 116.77, - "t": 315.82, - "r": 207.76, - "b": 329.54, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "and last row 2", - "column_header": false, - "row_header": true, - "row_section": false - }, - { - "bbox": { - "l": 251.77, - "t": 315.82, - "r": 299.73, - "b": 329.54, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "nothing", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 484.65, - "t": 315.82, - "r": 522.85, - "b": 329.54, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "inside", + "text": "Yet another value", "column_header": false, "row_header": false, "row_section": false @@ -3558,13 +4050,13 @@ "id": 0, "label": "table", "bbox": { - "l": 103.33, - "t": 75.14, - "r": 560.95, - "b": 360.93, + "l": 69.05, + "t": 87.65, + "r": 551.1, + "b": 334.58, "coord_origin": "TOPLEFT" }, - "confidence": 0.968, + "confidence": 0.979, "cells": [ { "index": 0, @@ -3575,21 +4067,21 @@ "a": 255 }, "rect": { - "r_x0": 245.02, - "r_y0": 120.29, - "r_x1": 307.59, - "r_y1": 120.29, - "r_x2": 307.59, - "r_y2": 106.57, - "r_x3": 245.02, - "r_y3": 106.57, + "r_x0": 97.33, + "r_y0": 126.33, + "r_x1": 190.0, + "r_y1": 126.33, + "r_x2": 190.0, + "r_y2": 105.67, + "r_x3": 97.33, + "r_y3": 105.67, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 89.0, + "from_ocr": true }, { "index": 1, @@ -3600,21 +4092,21 @@ "a": 255 }, "rect": { - "r_x0": 358.65, - "r_y0": 120.29, - "r_x1": 421.22, - "r_y1": 120.29, - "r_x2": 421.22, - "r_y2": 106.57, - "r_x3": 358.65, - "r_y3": 106.57, + "r_x0": 112.0, + "r_y0": 157.67, + "r_x1": 182.33, + "r_y1": 157.67, + "r_x2": 182.33, + "r_y2": 137.0, + "r_x3": 112.0, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 2, @@ -3625,21 +4117,21 @@ "a": 255 }, "rect": { - "r_x0": 472.27, - "r_y0": 120.29, - "r_x1": 534.84, - "r_y1": 120.29, - "r_x2": 534.84, - "r_y2": 106.57, - "r_x3": 472.27, - "r_y3": 106.57, + "r_x0": 121.67, + "r_y0": 220.0, + "r_x1": 168.67, + "r_y1": 220.0, + "r_x2": 168.67, + "r_y2": 204.33, + "r_x3": 121.67, + "r_y3": 204.33, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 3, @@ -3650,21 +4142,21 @@ "a": 255 }, "rect": { - "r_x0": 123.52, - "r_y0": 187.79, - "r_x1": 200.67, - "r_y1": 187.79, - "r_x2": 200.67, - "r_y2": 174.07, - "r_x3": 123.52, - "r_y3": 174.07, + "r_x0": 121.67, + "r_y0": 300.0, + "r_x1": 168.67, + "r_y1": 300.0, + "r_x2": 168.67, + "r_y2": 284.0, + "r_x3": 121.67, + "r_y3": 284.0, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 4, @@ -3675,21 +4167,21 @@ "a": 255 }, "rect": { - "r_x0": 241.65, - "r_y0": 187.79, - "r_x1": 310.71, - "r_y1": 187.79, - "r_x2": 310.71, - "r_y2": 174.07, - "r_x3": 241.65, - "r_y3": 174.07, + "r_x0": 232.67, + "r_y0": 126.33, + "r_x1": 364.0, + "r_y1": 126.33, + "r_x2": 364.0, + "r_y2": 105.67, + "r_x3": 232.67, + "r_y3": 105.67, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 5, @@ -3700,21 +4192,21 @@ "a": 255 }, "rect": { - "r_x0": 347.4, - "r_y0": 187.79, - "r_x1": 431.1, - "r_y1": 187.79, - "r_x2": 431.1, - "r_y2": 174.07, - "r_x3": 347.4, - "r_y3": 174.07, + "r_x0": 265.67, + "r_y0": 153.0, + "r_x1": 336.0, + "r_y1": 153.0, + "r_x2": 336.0, + "r_y2": 137.0, + "r_x3": 265.67, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 6, @@ -3725,21 +4217,21 @@ "a": 255 }, "rect": { - "r_x0": 491.4, - "r_y0": 187.79, - "r_x1": 515.79, - "r_y1": 187.79, - "r_x2": 515.79, - "r_y2": 174.07, - "r_x3": 491.4, - "r_y3": 174.07, + "r_x0": 247.0, + "r_y0": 204.33, + "r_x1": 349.67, + "r_y1": 204.33, + "r_x2": 349.67, + "r_y2": 188.33, + "r_x3": 247.0, + "r_y3": 188.33, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 7, @@ -3750,21 +4242,21 @@ "a": 255 }, "rect": { - "r_x0": 130.27, - "r_y0": 256.41, - "r_x1": 194.46, - "r_y1": 256.41, - "r_x2": 194.46, - "r_y2": 242.7, - "r_x3": 130.27, - "r_y3": 242.7, + "r_x0": 277.0, + "r_y0": 236.0, + "r_x1": 324.33, + "r_y1": 236.0, + "r_x2": 324.33, + "r_y2": 220.0, + "r_x3": 277.0, + "r_y3": 220.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 8, @@ -3775,21 +4267,21 @@ "a": 255 }, "rect": { - "r_x0": 373.27, - "r_y0": 256.41, - "r_x1": 406.59, - "r_y1": 256.41, - "r_x2": 406.59, - "r_y2": 242.7, - "r_x3": 373.27, - "r_y3": 242.7, + "r_x0": 247.0, + "r_y0": 284.0, + "r_x1": 349.67, + "r_y1": 284.0, + "r_x2": 349.67, + "r_y2": 268.0, + "r_x3": 247.0, + "r_y3": 268.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 9, @@ -3800,21 +4292,21 @@ "a": 255 }, "rect": { - "r_x0": 486.9, - "r_y0": 256.41, - "r_x1": 518.61, - "r_y1": 256.41, - "r_x2": 518.61, - "r_y2": 242.7, - "r_x3": 486.9, - "r_y3": 242.7, + "r_x0": 277.0, + "r_y0": 315.33, + "r_x1": 324.33, + "r_y1": 315.33, + "r_x2": 324.33, + "r_y2": 299.67, + "r_x3": 277.0, + "r_y3": 299.67, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 10, @@ -3825,21 +4317,21 @@ "a": 255 }, "rect": { - "r_x0": 116.77, - "r_y0": 329.54, - "r_x1": 207.76, - "r_y1": 329.54, - "r_x2": 207.76, - "r_y2": 315.82, - "r_x3": 116.77, - "r_y3": 315.82, + "r_x0": 406.33, + "r_y0": 121.67, + "r_x1": 518.33, + "r_y1": 121.67, + "r_x2": 518.33, + "r_y2": 105.67, + "r_x3": 406.33, + "r_y3": 105.67, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 11, @@ -3850,21 +4342,21 @@ "a": 255 }, "rect": { - "r_x0": 251.77, - "r_y0": 329.54, - "r_x1": 299.73, - "r_y1": 329.54, - "r_x2": 299.73, - "r_y2": 315.82, - "r_x3": 251.77, - "r_y3": 315.82, + "r_x0": 429.33, + "r_y0": 153.0, + "r_x1": 499.33, + "r_y1": 153.0, + "r_x2": 499.33, + "r_y2": 137.0, + "r_x3": 429.33, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 12, @@ -3875,35 +4367,110 @@ "a": 255 }, "rect": { - "r_x0": 484.65, - "r_y0": 329.54, - "r_x1": 522.85, - "r_y1": 329.54, - "r_x2": 522.85, - "r_y2": 315.82, - "r_x3": 484.65, - "r_y3": 315.82, + "r_x0": 408.33, + "r_y0": 204.33, + "r_x1": 514.0, + "r_y1": 204.33, + "r_x2": 514.0, + "r_y2": 188.33, + "r_x3": 408.33, + "r_y3": 188.33, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 440.67, + "r_y0": 236.0, + "r_x1": 487.67, + "r_y1": 236.0, + "r_x2": 487.67, + "r_y2": 220.0, + "r_x3": 440.67, + "r_y3": 220.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 408.33, + "r_y0": 284.0, + "r_x1": 514.0, + "r_y1": 284.0, + "r_x2": 514.0, + "r_y2": 268.0, + "r_x3": 408.33, + "r_y3": 268.0, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 440.67, + "r_y0": 315.33, + "r_x1": 487.67, + "r_y1": 315.33, + "r_x2": 487.67, + "r_y2": 299.67, + "r_x3": 440.67, + "r_y3": 299.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "children": [ { - "id": 14, + "id": 1, "label": "text", "bbox": { - "l": 245.02, - "t": 106.57, - "r": 307.59, - "b": 120.29, + "l": 97.33, + "t": 105.67, + "r": 190.0, + "b": 126.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 89.0, "cells": [ { "index": 0, @@ -3914,36 +4481,36 @@ "a": 255 }, "rect": { - "r_x0": 245.02, - "r_y0": 120.29, - "r_x1": 307.59, - "r_y1": 120.29, - "r_x2": 307.59, - "r_y2": 106.57, - "r_x3": 245.02, - "r_y3": 106.57, + "r_x0": 97.33, + "r_y0": 126.33, + "r_x1": 190.0, + "r_y1": 126.33, + "r_x2": 190.0, + "r_y2": 105.67, + "r_x3": 97.33, + "r_y3": 105.67, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 89.0, + "from_ocr": true } ], "children": [] }, { - "id": 15, + "id": 2, "label": "text", "bbox": { - "l": 358.65, - "t": 106.57, - "r": 421.22, - "b": 120.29, + "l": 112.0, + "t": 137.0, + "r": 182.33, + "b": 157.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 92.0, "cells": [ { "index": 1, @@ -3954,36 +4521,36 @@ "a": 255 }, "rect": { - "r_x0": 358.65, - "r_y0": 120.29, - "r_x1": 421.22, - "r_y1": 120.29, - "r_x2": 421.22, - "r_y2": 106.57, - "r_x3": 358.65, - "r_y3": 106.57, + "r_x0": 112.0, + "r_y0": 157.67, + "r_x1": 182.33, + "r_y1": 157.67, + "r_x2": 182.33, + "r_y2": 137.0, + "r_x3": 112.0, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true } ], "children": [] }, { - "id": 16, + "id": 3, "label": "text", "bbox": { - "l": 472.27, - "t": 106.57, - "r": 534.84, - "b": 120.29, + "l": 121.67, + "t": 204.33, + "r": 168.67, + "b": 220.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 2, @@ -3994,36 +4561,36 @@ "a": 255 }, "rect": { - "r_x0": 472.27, - "r_y0": 120.29, - "r_x1": 534.84, - "r_y1": 120.29, - "r_x2": 534.84, - "r_y2": 106.57, - "r_x3": 472.27, - "r_y3": 106.57, + "r_x0": 121.67, + "r_y0": 220.0, + "r_x1": 168.67, + "r_y1": 220.0, + "r_x2": 168.67, + "r_y2": 204.33, + "r_x3": 121.67, + "r_y3": 204.33, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 17, + "id": 4, "label": "text", "bbox": { - "l": 123.52, - "t": 174.07, - "r": 200.67, - "b": 187.79, + "l": 121.67, + "t": 284.0, + "r": 168.67, + "b": 300.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 3, @@ -4034,36 +4601,36 @@ "a": 255 }, "rect": { - "r_x0": 123.52, - "r_y0": 187.79, - "r_x1": 200.67, - "r_y1": 187.79, - "r_x2": 200.67, - "r_y2": 174.07, - "r_x3": 123.52, - "r_y3": 174.07, + "r_x0": 121.67, + "r_y0": 300.0, + "r_x1": 168.67, + "r_y1": 300.0, + "r_x2": 168.67, + "r_y2": 284.0, + "r_x3": 121.67, + "r_y3": 284.0, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 18, + "id": 5, "label": "text", "bbox": { - "l": 241.65, - "t": 174.07, - "r": 310.71, - "b": 187.79, + "l": 232.67, + "t": 105.67, + "r": 364.0, + "b": 126.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 92.0, "cells": [ { "index": 4, @@ -4074,36 +4641,36 @@ "a": 255 }, "rect": { - "r_x0": 241.65, - "r_y0": 187.79, - "r_x1": 310.71, - "r_y1": 187.79, - "r_x2": 310.71, - "r_y2": 174.07, - "r_x3": 241.65, - "r_y3": 174.07, + "r_x0": 232.67, + "r_y0": 126.33, + "r_x1": 364.0, + "r_y1": 126.33, + "r_x2": 364.0, + "r_y2": 105.67, + "r_x3": 232.67, + "r_y3": 105.67, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true } ], "children": [] }, { - "id": 19, + "id": 6, "label": "text", "bbox": { - "l": 347.4, - "t": 174.07, - "r": 431.1, - "b": 187.79, + "l": 265.67, + "t": 137.0, + "r": 336.0, + "b": 153.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 5, @@ -4114,36 +4681,36 @@ "a": 255 }, "rect": { - "r_x0": 347.4, - "r_y0": 187.79, - "r_x1": 431.1, - "r_y1": 187.79, - "r_x2": 431.1, - "r_y2": 174.07, - "r_x3": 347.4, - "r_y3": 174.07, + "r_x0": 265.67, + "r_y0": 153.0, + "r_x1": 336.0, + "r_y1": 153.0, + "r_x2": 336.0, + "r_y2": 137.0, + "r_x3": 265.67, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 20, + "id": 7, "label": "text", "bbox": { - "l": 491.4, - "t": 174.07, - "r": 515.79, - "b": 187.79, + "l": 247.0, + "t": 188.33, + "r": 349.67, + "b": 204.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 6, @@ -4154,36 +4721,36 @@ "a": 255 }, "rect": { - "r_x0": 491.4, - "r_y0": 187.79, - "r_x1": 515.79, - "r_y1": 187.79, - "r_x2": 515.79, - "r_y2": 174.07, - "r_x3": 491.4, - "r_y3": 174.07, + "r_x0": 247.0, + "r_y0": 204.33, + "r_x1": 349.67, + "r_y1": 204.33, + "r_x2": 349.67, + "r_y2": 188.33, + "r_x3": 247.0, + "r_y3": 188.33, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 21, + "id": 8, "label": "text", "bbox": { - "l": 130.27, - "t": 242.7, - "r": 194.46, - "b": 256.41, + "l": 277.0, + "t": 220.0, + "r": 324.33, + "b": 236.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 7, @@ -4194,36 +4761,36 @@ "a": 255 }, "rect": { - "r_x0": 130.27, - "r_y0": 256.41, - "r_x1": 194.46, - "r_y1": 256.41, - "r_x2": 194.46, - "r_y2": 242.7, - "r_x3": 130.27, - "r_y3": 242.7, + "r_x0": 277.0, + "r_y0": 236.0, + "r_x1": 324.33, + "r_y1": 236.0, + "r_x2": 324.33, + "r_y2": 220.0, + "r_x3": 277.0, + "r_y3": 220.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 22, + "id": 9, "label": "text", "bbox": { - "l": 373.27, - "t": 242.7, - "r": 406.59, - "b": 256.41, + "l": 247.0, + "t": 268.0, + "r": 349.67, + "b": 284.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 92.0, "cells": [ { "index": 8, @@ -4234,36 +4801,36 @@ "a": 255 }, "rect": { - "r_x0": 373.27, - "r_y0": 256.41, - "r_x1": 406.59, - "r_y1": 256.41, - "r_x2": 406.59, - "r_y2": 242.7, - "r_x3": 373.27, - "r_y3": 242.7, + "r_x0": 247.0, + "r_y0": 284.0, + "r_x1": 349.67, + "r_y1": 284.0, + "r_x2": 349.67, + "r_y2": 268.0, + "r_x3": 247.0, + "r_y3": 268.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true } ], "children": [] }, { - "id": 23, + "id": 10, "label": "text", "bbox": { - "l": 486.9, - "t": 242.7, - "r": 518.61, - "b": 256.41, + "l": 277.0, + "t": 299.67, + "r": 324.33, + "b": 315.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 9, @@ -4274,36 +4841,36 @@ "a": 255 }, "rect": { - "r_x0": 486.9, - "r_y0": 256.41, - "r_x1": 518.61, - "r_y1": 256.41, - "r_x2": 518.61, - "r_y2": 242.7, - "r_x3": 486.9, - "r_y3": 242.7, + "r_x0": 277.0, + "r_y0": 315.33, + "r_x1": 324.33, + "r_y1": 315.33, + "r_x2": 324.33, + "r_y2": 299.67, + "r_x3": 277.0, + "r_y3": 299.67, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 24, + "id": 11, "label": "text", "bbox": { - "l": 116.77, - "t": 315.82, - "r": 207.76, - "b": 329.54, + "l": 406.33, + "t": 105.67, + "r": 518.33, + "b": 121.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 10, @@ -4314,36 +4881,36 @@ "a": 255 }, "rect": { - "r_x0": 116.77, - "r_y0": 329.54, - "r_x1": 207.76, - "r_y1": 329.54, - "r_x2": 207.76, - "r_y2": 315.82, - "r_x3": 116.77, - "r_y3": 315.82, + "r_x0": 406.33, + "r_y0": 121.67, + "r_x1": 518.33, + "r_y1": 121.67, + "r_x2": 518.33, + "r_y2": 105.67, + "r_x3": 406.33, + "r_y3": 105.67, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 25, + "id": 12, "label": "text", "bbox": { - "l": 251.77, - "t": 315.82, - "r": 299.73, - "b": 329.54, + "l": 429.33, + "t": 137.0, + "r": 499.33, + "b": 153.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 11, @@ -4354,36 +4921,36 @@ "a": 255 }, "rect": { - "r_x0": 251.77, - "r_y0": 329.54, - "r_x1": 299.73, - "r_y1": 329.54, - "r_x2": 299.73, - "r_y2": 315.82, - "r_x3": 251.77, - "r_y3": 315.82, + "r_x0": 429.33, + "r_y0": 153.0, + "r_x1": 499.33, + "r_y1": 153.0, + "r_x2": 499.33, + "r_y2": 137.0, + "r_x3": 429.33, + "r_y3": 137.0, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 26, + "id": 13, "label": "text", "bbox": { - "l": 484.65, - "t": 315.82, - "r": 522.85, - "b": 329.54, + "l": 408.33, + "t": 188.33, + "r": 514.0, + "b": 204.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 12, @@ -4394,21 +4961,141 @@ "a": 255 }, "rect": { - "r_x0": 484.65, - "r_y0": 329.54, - "r_x1": 522.85, - "r_y1": 329.54, - "r_x2": 522.85, - "r_y2": 315.82, - "r_x3": 484.65, - "r_y3": 315.82, + "r_x0": 408.33, + "r_y0": 204.33, + "r_x1": 514.0, + "r_y1": 204.33, + "r_x2": 514.0, + "r_y2": 188.33, + "r_x3": 408.33, + "r_y3": 188.33, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 14, + "label": "text", + "bbox": { + "l": 440.67, + "t": 220.0, + "r": 487.67, + "b": 236.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 440.67, + "r_y0": 236.0, + "r_x1": 487.67, + "r_y1": 236.0, + "r_x2": 487.67, + "r_y2": 220.0, + "r_x3": 440.67, + "r_y3": 220.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 15, + "label": "text", + "bbox": { + "l": 408.33, + "t": 268.0, + "r": 514.0, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 408.33, + "r_y0": 284.0, + "r_x1": 514.0, + "r_y1": 284.0, + "r_x2": 514.0, + "r_y2": 268.0, + "r_x3": 408.33, + "r_y3": 268.0, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 16, + "label": "text", + "bbox": { + "l": 440.67, + "t": 299.67, + "r": 487.67, + "b": 315.33, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 440.67, + "r_y0": 315.33, + "r_x1": 487.67, + "r_y1": 315.33, + "r_x2": 487.67, + "r_y2": 299.67, + "r_x3": 440.67, + "r_y3": 299.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "children": [] @@ -4417,93 +5104,47 @@ }, "text": null, "otsl_seq": [ - "ecel", "ched", "ched", "ched", "nl", - "rhed", "fcel", "fcel", "fcel", "nl", - "rhed", - "ecel", "fcel", "fcel", - "nl", - "rhed", - "fcel", - "ecel", "fcel", "nl" ], - "num_rows": 4, - "num_cols": 4, + "num_rows": 3, + "num_cols": 3, "table_cells": [ { "bbox": { - "l": 245.02, - "t": 106.57, - "r": 307.59, - "b": 120.29, + "l": 97.33, + "t": 105.67, + "r": 190.0, + "b": 126.33, "coord_origin": "TOPLEFT" }, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "Column 0", + "start_col_offset_idx": 0, + "end_col_offset_idx": 1, + "text": "Vertically merged", "column_header": true, "row_header": false, "row_section": false }, { "bbox": { - "l": 358.65, - "t": 106.57, - "r": 421.22, - "b": 120.29, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "Column 1", - "column_header": true, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 472.27, - "t": 106.57, - "r": 534.84, - "b": 120.29, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "Column 2", - "column_header": true, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 123.52, - "t": 174.07, - "r": 200.67, - "b": 187.79, + "l": 121.67, + "t": 204.33, + "r": 168.67, + "b": 220.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -4512,74 +5153,17 @@ "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, - "text": "this is row 0", - "column_header": false, - "row_header": true, - "row_section": false - }, - { - "bbox": { - "l": 241.65, - "t": 174.07, - "r": 310.71, - "b": 187.79, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "some cells", + "text": "value", "column_header": false, "row_header": false, "row_section": false }, { "bbox": { - "l": 347.4, - "t": 174.07, - "r": 431.1, - "b": 187.79, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "have content", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 491.4, - "t": 174.07, - "r": 515.79, - "b": 187.79, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "and", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 130.27, - "t": 242.7, - "r": 194.46, - "b": 256.41, + "l": 121.67, + "t": 284.0, + "r": 168.67, + "b": 300.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -4588,17 +5172,112 @@ "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, - "text": "and row 1", + "text": "value", "column_header": false, - "row_header": true, + "row_header": false, "row_section": false }, { "bbox": { - "l": 373.27, - "t": 242.7, - "r": 406.59, - "b": 256.41, + "l": 232.67, + "t": 105.67, + "r": 364.0, + "b": 126.33, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Other merged column", + "column_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 247.0, + "t": 188.33, + "r": 349.67, + "b": 204.33, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Some other value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 247.0, + "t": 268.0, + "r": 349.67, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 2, + "end_row_offset_idx": 3, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Some other value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 406.33, + "t": 105.67, + "r": 518.33, + "b": 121.67, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another column", + "column_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 408.33, + "t": 188.33, + "r": 514.0, + "b": 204.33, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 408.33, + "t": 268.0, + "r": 514.0, + "b": 284.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -4607,83 +5286,7 @@ "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, - "text": "other", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 486.9, - "t": 242.7, - "r": 518.61, - "b": 256.41, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "have", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 116.77, - "t": 315.82, - "r": 207.76, - "b": 329.54, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "and last row 2", - "column_header": false, - "row_header": true, - "row_section": false - }, - { - "bbox": { - "l": 251.77, - "t": 315.82, - "r": 299.73, - "b": 329.54, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "nothing", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 484.65, - "t": 315.82, - "r": 522.85, - "b": 329.54, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "inside", + "text": "Yet another value", "column_header": false, "row_header": false, "row_section": false diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_180.doctags.txt b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_180.doctags.txt index 0eab0ecc..1d7f0742 100644 --- a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_180.doctags.txt +++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_180.doctags.txt @@ -1,2 +1,2 @@ -insidenothingand last row 2haveotherand row 1andhave contentsome cellsthis is row 0Column 2Column 1Column 0 +Vertically mergedOther merged columnYet another columnvalueSome other valueYet another valuevalueSome other valueYet another value \ No newline at end of file diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_180.json b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_180.json index aec34f31..76cc6098 100644 --- a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_180.json +++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_180.json @@ -4,7 +4,7 @@ "name": "ocr_test_rotated_180", "origin": { "mimetype": "application/pdf", - "binary_hash": 9953198396702586979, + "binary_hash": 16151733167151414937, "filename": "ocr_test_rotated_180.pdf" }, "furniture": { @@ -41,10 +41,10 @@ { "page_no": 1, "bbox": { - "l": 280.59, - "t": 361.27, - "r": 738.57, - "b": 75.91, + "l": 240.9, + "t": 334.58, + "r": 722.95, + "b": 87.65, "coord_origin": "BOTTOMLEFT" }, "charspan": [ @@ -60,238 +60,10 @@ "table_cells": [ { "bbox": { - "l": 534.41, - "t": 474.71, - "r": 596.97, - "b": 488.43, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "Column 0", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 420.78, - "t": 474.71, - "r": 483.35, - "b": 488.43, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "Column 1", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 307.16, - "t": 474.71, - "r": 369.73, - "b": 488.43, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "Column 2", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 641.33, - "t": 407.21, - "r": 718.47, - "b": 420.93, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "this is row 0", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 531.29, - "t": 407.21, - "r": 600.35, - "b": 420.93, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "some cells", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 410.9, - "t": 407.21, - "r": 494.6, - "b": 420.93, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "have content", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 326.21, - "t": 407.21, - "r": 350.6, - "b": 420.93, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "and", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 647.54, - "t": 338.59, - "r": 711.72, - "b": 352.3, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "and row 1", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 435.41, - "t": 338.59, - "r": 468.73, - "b": 352.3, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "other", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 323.39, - "t": 338.59, - "r": 355.1, - "b": 352.3, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "have", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 634.24, - "t": 265.46, - "r": 725.22, - "b": 279.18, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "and last row 2", - "column_header": true, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 542.27, - "t": 265.46, - "r": 590.22, - "b": 279.18, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "nothing", - "column_header": true, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 319.15, - "t": 265.46, - "r": 357.35, - "b": 279.18, + "l": 97.33, + "t": 105.67, + "r": 190.0, + "b": 126.33, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -300,22 +72,174 @@ "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, - "text": "inside", + "text": "Vertically merged", "column_header": true, "row_header": false, "row_section": false + }, + { + "bbox": { + "l": 121.67, + "t": 204.0, + "r": 168.67, + "b": 220.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 0, + "end_col_offset_idx": 1, + "text": "value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 121.67, + "t": 284.0, + "r": 168.67, + "b": 300.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 2, + "end_row_offset_idx": 3, + "start_col_offset_idx": 0, + "end_col_offset_idx": 1, + "text": "value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 232.33, + "t": 105.67, + "r": 363.67, + "b": 126.33, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Other merged column", + "column_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 247.0, + "t": 188.0, + "r": 349.67, + "b": 204.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Some other value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 247.0, + "t": 268.0, + "r": 349.67, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 2, + "end_row_offset_idx": 3, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Some other value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 406.33, + "t": 105.67, + "r": 518.0, + "b": 121.67, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another column", + "column_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 408.33, + "t": 188.0, + "r": 514.0, + "b": 204.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 408.33, + "t": 268.0, + "r": 514.0, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 2, + "end_row_offset_idx": 3, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another value", + "column_header": false, + "row_header": false, + "row_section": false } ], - "num_rows": 4, - "num_cols": 4, + "num_rows": 3, + "num_cols": 3, "grid": [ [ { "bbox": { - "l": 319.15, - "t": 265.46, - "r": 357.35, - "b": 279.18, + "l": 97.33, + "t": 105.67, + "r": 190.0, + "b": 126.33, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -324,29 +248,36 @@ "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, - "text": "inside", + "text": "Vertically merged", "column_header": true, "row_header": false, "row_section": false }, { + "bbox": { + "l": 232.33, + "t": 105.67, + "r": 363.67, + "b": 126.33, + "coord_origin": "TOPLEFT" + }, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, - "text": "", - "column_header": false, + "text": "Other merged column", + "column_header": true, "row_header": false, "row_section": false }, { "bbox": { - "l": 542.27, - "t": 265.46, - "r": 590.22, - "b": 279.18, + "l": 406.33, + "t": 105.67, + "r": 518.0, + "b": 121.67, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -355,26 +286,7 @@ "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, - "text": "nothing", - "column_header": true, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 634.24, - "t": 265.46, - "r": 725.22, - "b": 279.18, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "and last row 2", + "text": "Yet another column", "column_header": true, "row_header": false, "row_section": false @@ -383,10 +295,10 @@ [ { "bbox": { - "l": 323.39, - "t": 338.59, - "r": 355.1, - "b": 352.3, + "l": 121.67, + "t": 204.0, + "r": 168.67, + "b": 220.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -395,17 +307,17 @@ "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, - "text": "have", + "text": "value", "column_header": false, "row_header": false, "row_section": false }, { "bbox": { - "l": 435.41, - "t": 338.59, - "r": 468.73, - "b": 352.3, + "l": 247.0, + "t": 188.0, + "r": 349.67, + "b": 204.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -414,38 +326,26 @@ "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, - "text": "other", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "", + "text": "Some other value", "column_header": false, "row_header": false, "row_section": false }, { "bbox": { - "l": 647.54, - "t": 338.59, - "r": 711.72, - "b": 352.3, + "l": 408.33, + "t": 188.0, + "r": 514.0, + "b": 204.0, "coord_origin": "TOPLEFT" }, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "and row 1", + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another value", "column_header": false, "row_header": false, "row_section": false @@ -454,10 +354,10 @@ [ { "bbox": { - "l": 326.21, - "t": 407.21, - "r": 350.6, - "b": 420.93, + "l": 121.67, + "t": 284.0, + "r": 168.67, + "b": 300.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -466,17 +366,17 @@ "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, - "text": "and", + "text": "value", "column_header": false, "row_header": false, "row_section": false }, { "bbox": { - "l": 410.9, - "t": 407.21, - "r": 494.6, - "b": 420.93, + "l": 247.0, + "t": 268.0, + "r": 349.67, + "b": 284.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -485,17 +385,17 @@ "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, - "text": "have content", + "text": "Some other value", "column_header": false, "row_header": false, "row_section": false }, { "bbox": { - "l": 531.29, - "t": 407.21, - "r": 600.35, - "b": 420.93, + "l": 408.33, + "t": 268.0, + "r": 514.0, + "b": 284.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -504,97 +404,7 @@ "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, - "text": "some cells", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 641.33, - "t": 407.21, - "r": 718.47, - "b": 420.93, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "this is row 0", - "column_header": false, - "row_header": false, - "row_section": false - } - ], - [ - { - "bbox": { - "l": 307.16, - "t": 474.71, - "r": 369.73, - "b": 488.43, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "Column 2", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 420.78, - "t": 474.71, - "r": 483.35, - "b": 488.43, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "Column 1", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 534.41, - "t": 474.71, - "r": 596.97, - "b": 488.43, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "Column 0", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "", + "text": "Yet another value", "column_header": false, "row_header": false, "row_section": false @@ -610,8 +420,8 @@ "pages": { "1": { "size": { - "width": 842.0, - "height": 595.0 + "width": 792.0, + "height": 612.0 }, "page_no": 1 } diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_180.md b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_180.md index 8521b3f9..e3d7c0b8 100644 --- a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_180.md +++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_180.md @@ -1,5 +1,4 @@ -| inside | | nothing | and last row 2 | -|----------|--------------|------------|------------------| -| have | other | | and row 1 | -| and | have content | some cells | this is row 0 | -| Column 2 | Column 1 | Column 0 | | \ No newline at end of file +| Vertically merged | Other merged column | Yet another column | +|---------------------|-----------------------|----------------------| +| value | Some other value | Yet another value | +| value | Some other value | Yet another value | \ No newline at end of file diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_180.pages.json b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_180.pages.json index 256df68f..6d1b52fb 100644 --- a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_180.pages.json +++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_180.pages.json @@ -2,8 +2,8 @@ { "page_no": 0, "size": { - "width": 842.0, - "height": 595.0 + "width": 792.0, + "height": 612.0 }, "parsed_page": { "dimension": { @@ -11,47 +11,47 @@ "rect": { "r_x0": 0.0, "r_y0": 0.0, - "r_x1": 842.0, + "r_x1": 792.0, "r_y1": 0.0, - "r_x2": 842.0, - "r_y2": 595.0, + "r_x2": 792.0, + "r_y2": 612.0, "r_x3": 0.0, - "r_y3": 595.0, + "r_y3": 612.0, "coord_origin": "BOTTOMLEFT" }, "boundary_type": "crop_box", "art_bbox": { "l": 0.0, - "t": 595.0, - "r": 842.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" }, "bleed_bbox": { "l": 0.0, - "t": 595.0, - "r": 842.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" }, "crop_bbox": { "l": 0.0, - "t": 595.0, - "r": 842.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" }, "media_bbox": { "l": 0.0, - "t": 595.0, - "r": 842.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" }, "trim_bbox": { "l": 0.0, - "t": 595.0, - "r": 842.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" } @@ -69,21 +69,21 @@ "a": 255 }, "rect": { - "r_x0": 534.41, - "r_y0": 488.43, - "r_x1": 596.97, - "r_y1": 488.43, - "r_x2": 596.97, - "r_y2": 474.71, - "r_x3": 534.41, - "r_y3": 474.71, + "r_x0": 694.67, + "r_y0": 485.67, + "r_x1": 602.0, + "r_y1": 485.67, + "r_x2": 602.0, + "r_y2": 506.33, + "r_x3": 694.67, + "r_y3": 506.33, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true }, { "index": 1, @@ -94,21 +94,21 @@ "a": 255 }, "rect": { - "r_x0": 420.78, - "r_y0": 488.43, - "r_x1": 483.35, - "r_y1": 488.43, - "r_x2": 483.35, - "r_y2": 474.71, - "r_x3": 420.78, - "r_y3": 474.71, + "r_x0": 680.0, + "r_y0": 454.33, + "r_x1": 610.0, + "r_y1": 454.33, + "r_x2": 610.0, + "r_y2": 475.0, + "r_x3": 680.0, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true }, { "index": 2, @@ -119,21 +119,21 @@ "a": 255 }, "rect": { - "r_x0": 307.16, - "r_y0": 488.43, - "r_x1": 369.73, - "r_y1": 488.43, - "r_x2": 369.73, - "r_y2": 474.71, - "r_x3": 307.16, - "r_y3": 474.71, + "r_x0": 670.33, + "r_y0": 392.0, + "r_x1": 623.33, + "r_y1": 392.0, + "r_x2": 623.33, + "r_y2": 408.0, + "r_x3": 670.33, + "r_y3": 408.0, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 3, @@ -144,21 +144,21 @@ "a": 255 }, "rect": { - "r_x0": 641.33, - "r_y0": 420.93, - "r_x1": 718.47, - "r_y1": 420.93, - "r_x2": 718.47, - "r_y2": 407.21, - "r_x3": 641.33, - "r_y3": 407.21, + "r_x0": 670.33, + "r_y0": 312.0, + "r_x1": 623.33, + "r_y1": 312.0, + "r_x2": 623.33, + "r_y2": 328.0, + "r_x3": 670.33, + "r_y3": 328.0, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 4, @@ -169,21 +169,21 @@ "a": 255 }, "rect": { - "r_x0": 531.29, - "r_y0": 420.93, - "r_x1": 600.35, - "r_y1": 420.93, - "r_x2": 600.35, - "r_y2": 407.21, - "r_x3": 531.29, - "r_y3": 407.21, + "r_x0": 559.67, + "r_y0": 485.67, + "r_x1": 428.33, + "r_y1": 485.67, + "r_x2": 428.33, + "r_y2": 506.33, + "r_x3": 559.67, + "r_y3": 506.33, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 5, @@ -194,21 +194,21 @@ "a": 255 }, "rect": { - "r_x0": 410.9, - "r_y0": 420.93, - "r_x1": 494.6, - "r_y1": 420.93, - "r_x2": 494.6, - "r_y2": 407.21, - "r_x3": 410.9, - "r_y3": 407.21, + "r_x0": 526.67, + "r_y0": 459.0, + "r_x1": 456.0, + "r_y1": 459.0, + "r_x2": 456.0, + "r_y2": 475.0, + "r_x3": 526.67, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 6, @@ -219,21 +219,21 @@ "a": 255 }, "rect": { - "r_x0": 326.21, - "r_y0": 420.93, - "r_x1": 350.6, - "r_y1": 420.93, - "r_x2": 350.6, - "r_y2": 407.21, - "r_x3": 326.21, - "r_y3": 407.21, + "r_x0": 545.0, + "r_y0": 408.0, + "r_x1": 442.33, + "r_y1": 408.0, + "r_x2": 442.33, + "r_y2": 424.0, + "r_x3": 545.0, + "r_y3": 424.0, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 91.0, + "from_ocr": true }, { "index": 7, @@ -244,21 +244,21 @@ "a": 255 }, "rect": { - "r_x0": 647.54, - "r_y0": 352.3, - "r_x1": 711.72, - "r_y1": 352.3, - "r_x2": 711.72, - "r_y2": 338.59, - "r_x3": 647.54, - "r_y3": 338.59, + "r_x0": 515.0, + "r_y0": 376.0, + "r_x1": 468.0, + "r_y1": 376.0, + "r_x2": 468.0, + "r_y2": 392.0, + "r_x3": 515.0, + "r_y3": 392.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 8, @@ -269,21 +269,21 @@ "a": 255 }, "rect": { - "r_x0": 435.41, - "r_y0": 352.3, - "r_x1": 468.73, - "r_y1": 352.3, - "r_x2": 468.73, - "r_y2": 338.59, - "r_x3": 435.41, - "r_y3": 338.59, + "r_x0": 545.0, + "r_y0": 328.0, + "r_x1": 442.33, + "r_y1": 328.0, + "r_x2": 442.33, + "r_y2": 344.0, + "r_x3": 545.0, + "r_y3": 344.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 9, @@ -294,21 +294,21 @@ "a": 255 }, "rect": { - "r_x0": 323.39, - "r_y0": 352.3, - "r_x1": 355.1, - "r_y1": 352.3, - "r_x2": 355.1, - "r_y2": 338.59, - "r_x3": 323.39, - "r_y3": 338.59, + "r_x0": 515.0, + "r_y0": 296.67, + "r_x1": 468.0, + "r_y1": 296.67, + "r_x2": 468.0, + "r_y2": 312.67, + "r_x3": 515.0, + "r_y3": 312.67, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 10, @@ -319,21 +319,21 @@ "a": 255 }, "rect": { - "r_x0": 634.24, - "r_y0": 279.18, - "r_x1": 725.22, - "r_y1": 279.18, - "r_x2": 725.22, - "r_y2": 265.46, - "r_x3": 634.24, - "r_y3": 265.46, + "r_x0": 385.67, + "r_y0": 490.33, + "r_x1": 274.0, + "r_y1": 490.33, + "r_x2": 274.0, + "r_y2": 506.33, + "r_x3": 385.67, + "r_y3": 506.33, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 11, @@ -344,21 +344,21 @@ "a": 255 }, "rect": { - "r_x0": 542.27, - "r_y0": 279.18, - "r_x1": 590.22, - "r_y1": 279.18, - "r_x2": 590.22, - "r_y2": 265.46, - "r_x3": 542.27, - "r_y3": 265.46, + "r_x0": 363.0, + "r_y0": 459.0, + "r_x1": 292.67, + "r_y1": 459.0, + "r_x2": 292.67, + "r_y2": 475.0, + "r_x3": 363.0, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 12, @@ -369,21 +369,96 @@ "a": 255 }, "rect": { - "r_x0": 319.15, - "r_y0": 279.18, - "r_x1": 357.35, - "r_y1": 279.18, - "r_x2": 357.35, - "r_y2": 265.46, - "r_x3": 319.15, - "r_y3": 265.46, + "r_x0": 383.67, + "r_y0": 408.0, + "r_x1": 278.0, + "r_y1": 408.0, + "r_x2": 278.0, + "r_y2": 424.0, + "r_x3": 383.67, + "r_y3": 424.0, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true + }, + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 351.33, + "r_y0": 376.0, + "r_x1": 304.33, + "r_y1": 376.0, + "r_x2": 304.33, + "r_y2": 392.0, + "r_x3": 351.33, + "r_y3": 392.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + }, + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 383.67, + "r_y0": 328.0, + "r_x1": 278.0, + "r_y1": 328.0, + "r_x2": 278.0, + "r_y2": 344.0, + "r_x3": 383.67, + "r_y3": 344.0, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + }, + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 351.33, + "r_y0": 296.67, + "r_x1": 304.33, + "r_y1": 296.67, + "r_x2": 304.33, + "r_y2": 312.67, + "r_x3": 351.33, + "r_y3": 312.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "has_chars": false, @@ -399,13 +474,13 @@ "id": 0, "label": "table", "bbox": { - "l": 280.59, - "t": 233.73, - "r": 738.57, - "b": 519.09, + "l": 240.9, + "t": 277.42, + "r": 722.95, + "b": 524.35, "coord_origin": "TOPLEFT" }, - "confidence": 0.955, + "confidence": 0.979, "cells": [ { "index": 0, @@ -416,21 +491,21 @@ "a": 255 }, "rect": { - "r_x0": 534.41, - "r_y0": 488.43, - "r_x1": 596.97, - "r_y1": 488.43, - "r_x2": 596.97, - "r_y2": 474.71, - "r_x3": 534.41, - "r_y3": 474.71, + "r_x0": 694.67, + "r_y0": 485.67, + "r_x1": 602.0, + "r_y1": 485.67, + "r_x2": 602.0, + "r_y2": 506.33, + "r_x3": 694.67, + "r_y3": 506.33, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true }, { "index": 1, @@ -441,21 +516,21 @@ "a": 255 }, "rect": { - "r_x0": 420.78, - "r_y0": 488.43, - "r_x1": 483.35, - "r_y1": 488.43, - "r_x2": 483.35, - "r_y2": 474.71, - "r_x3": 420.78, - "r_y3": 474.71, + "r_x0": 680.0, + "r_y0": 454.33, + "r_x1": 610.0, + "r_y1": 454.33, + "r_x2": 610.0, + "r_y2": 475.0, + "r_x3": 680.0, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true }, { "index": 2, @@ -466,21 +541,21 @@ "a": 255 }, "rect": { - "r_x0": 307.16, - "r_y0": 488.43, - "r_x1": 369.73, - "r_y1": 488.43, - "r_x2": 369.73, - "r_y2": 474.71, - "r_x3": 307.16, - "r_y3": 474.71, + "r_x0": 670.33, + "r_y0": 392.0, + "r_x1": 623.33, + "r_y1": 392.0, + "r_x2": 623.33, + "r_y2": 408.0, + "r_x3": 670.33, + "r_y3": 408.0, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 3, @@ -491,21 +566,21 @@ "a": 255 }, "rect": { - "r_x0": 641.33, - "r_y0": 420.93, - "r_x1": 718.47, - "r_y1": 420.93, - "r_x2": 718.47, - "r_y2": 407.21, - "r_x3": 641.33, - "r_y3": 407.21, + "r_x0": 670.33, + "r_y0": 312.0, + "r_x1": 623.33, + "r_y1": 312.0, + "r_x2": 623.33, + "r_y2": 328.0, + "r_x3": 670.33, + "r_y3": 328.0, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 4, @@ -516,21 +591,21 @@ "a": 255 }, "rect": { - "r_x0": 531.29, - "r_y0": 420.93, - "r_x1": 600.35, - "r_y1": 420.93, - "r_x2": 600.35, - "r_y2": 407.21, - "r_x3": 531.29, - "r_y3": 407.21, + "r_x0": 559.67, + "r_y0": 485.67, + "r_x1": 428.33, + "r_y1": 485.67, + "r_x2": 428.33, + "r_y2": 506.33, + "r_x3": 559.67, + "r_y3": 506.33, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 5, @@ -541,21 +616,21 @@ "a": 255 }, "rect": { - "r_x0": 410.9, - "r_y0": 420.93, - "r_x1": 494.6, - "r_y1": 420.93, - "r_x2": 494.6, - "r_y2": 407.21, - "r_x3": 410.9, - "r_y3": 407.21, + "r_x0": 526.67, + "r_y0": 459.0, + "r_x1": 456.0, + "r_y1": 459.0, + "r_x2": 456.0, + "r_y2": 475.0, + "r_x3": 526.67, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 6, @@ -566,21 +641,21 @@ "a": 255 }, "rect": { - "r_x0": 326.21, - "r_y0": 420.93, - "r_x1": 350.6, - "r_y1": 420.93, - "r_x2": 350.6, - "r_y2": 407.21, - "r_x3": 326.21, - "r_y3": 407.21, + "r_x0": 545.0, + "r_y0": 408.0, + "r_x1": 442.33, + "r_y1": 408.0, + "r_x2": 442.33, + "r_y2": 424.0, + "r_x3": 545.0, + "r_y3": 424.0, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 91.0, + "from_ocr": true }, { "index": 7, @@ -591,21 +666,21 @@ "a": 255 }, "rect": { - "r_x0": 647.54, - "r_y0": 352.3, - "r_x1": 711.72, - "r_y1": 352.3, - "r_x2": 711.72, - "r_y2": 338.59, - "r_x3": 647.54, - "r_y3": 338.59, + "r_x0": 515.0, + "r_y0": 376.0, + "r_x1": 468.0, + "r_y1": 376.0, + "r_x2": 468.0, + "r_y2": 392.0, + "r_x3": 515.0, + "r_y3": 392.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 8, @@ -616,21 +691,21 @@ "a": 255 }, "rect": { - "r_x0": 435.41, - "r_y0": 352.3, - "r_x1": 468.73, - "r_y1": 352.3, - "r_x2": 468.73, - "r_y2": 338.59, - "r_x3": 435.41, - "r_y3": 338.59, + "r_x0": 545.0, + "r_y0": 328.0, + "r_x1": 442.33, + "r_y1": 328.0, + "r_x2": 442.33, + "r_y2": 344.0, + "r_x3": 545.0, + "r_y3": 344.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 9, @@ -641,21 +716,21 @@ "a": 255 }, "rect": { - "r_x0": 323.39, - "r_y0": 352.3, - "r_x1": 355.1, - "r_y1": 352.3, - "r_x2": 355.1, - "r_y2": 338.59, - "r_x3": 323.39, - "r_y3": 338.59, + "r_x0": 515.0, + "r_y0": 296.67, + "r_x1": 468.0, + "r_y1": 296.67, + "r_x2": 468.0, + "r_y2": 312.67, + "r_x3": 515.0, + "r_y3": 312.67, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 10, @@ -666,21 +741,21 @@ "a": 255 }, "rect": { - "r_x0": 634.24, - "r_y0": 279.18, - "r_x1": 725.22, - "r_y1": 279.18, - "r_x2": 725.22, - "r_y2": 265.46, - "r_x3": 634.24, - "r_y3": 265.46, + "r_x0": 385.67, + "r_y0": 490.33, + "r_x1": 274.0, + "r_y1": 490.33, + "r_x2": 274.0, + "r_y2": 506.33, + "r_x3": 385.67, + "r_y3": 506.33, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 11, @@ -691,21 +766,21 @@ "a": 255 }, "rect": { - "r_x0": 542.27, - "r_y0": 279.18, - "r_x1": 590.22, - "r_y1": 279.18, - "r_x2": 590.22, - "r_y2": 265.46, - "r_x3": 542.27, - "r_y3": 265.46, + "r_x0": 363.0, + "r_y0": 459.0, + "r_x1": 292.67, + "r_y1": 459.0, + "r_x2": 292.67, + "r_y2": 475.0, + "r_x3": 363.0, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 12, @@ -716,35 +791,110 @@ "a": 255 }, "rect": { - "r_x0": 319.15, - "r_y0": 279.18, - "r_x1": 357.35, - "r_y1": 279.18, - "r_x2": 357.35, - "r_y2": 265.46, - "r_x3": 319.15, - "r_y3": 265.46, + "r_x0": 383.67, + "r_y0": 408.0, + "r_x1": 278.0, + "r_y1": 408.0, + "r_x2": 278.0, + "r_y2": 424.0, + "r_x3": 383.67, + "r_y3": 424.0, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true + }, + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 351.33, + "r_y0": 376.0, + "r_x1": 304.33, + "r_y1": 376.0, + "r_x2": 304.33, + "r_y2": 392.0, + "r_x3": 351.33, + "r_y3": 392.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + }, + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 383.67, + "r_y0": 328.0, + "r_x1": 278.0, + "r_y1": 328.0, + "r_x2": 278.0, + "r_y2": 344.0, + "r_x3": 383.67, + "r_y3": 344.0, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + }, + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 351.33, + "r_y0": 296.67, + "r_x1": 304.33, + "r_y1": 296.67, + "r_x2": 304.33, + "r_y2": 312.67, + "r_x3": 351.33, + "r_y3": 312.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "children": [ { - "id": 16, + "id": 1, "label": "text", "bbox": { - "l": 534.41, - "t": 474.71, - "r": 596.97, - "b": 488.43, + "l": 602.0, + "t": 485.67, + "r": 694.67, + "b": 506.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 90.0, "cells": [ { "index": 0, @@ -755,36 +905,36 @@ "a": 255 }, "rect": { - "r_x0": 534.41, - "r_y0": 488.43, - "r_x1": 596.97, - "r_y1": 488.43, - "r_x2": 596.97, - "r_y2": 474.71, - "r_x3": 534.41, - "r_y3": 474.71, + "r_x0": 694.67, + "r_y0": 485.67, + "r_x1": 602.0, + "r_y1": 485.67, + "r_x2": 602.0, + "r_y2": 506.33, + "r_x3": 694.67, + "r_y3": 506.33, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true } ], "children": [] }, { - "id": 17, + "id": 2, "label": "text", "bbox": { - "l": 420.78, - "t": 474.71, - "r": 483.35, - "b": 488.43, + "l": 610.0, + "t": 454.33, + "r": 680.0, + "b": 475.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 90.0, "cells": [ { "index": 1, @@ -795,36 +945,36 @@ "a": 255 }, "rect": { - "r_x0": 420.78, - "r_y0": 488.43, - "r_x1": 483.35, - "r_y1": 488.43, - "r_x2": 483.35, - "r_y2": 474.71, - "r_x3": 420.78, - "r_y3": 474.71, + "r_x0": 680.0, + "r_y0": 454.33, + "r_x1": 610.0, + "r_y1": 454.33, + "r_x2": 610.0, + "r_y2": 475.0, + "r_x3": 680.0, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true } ], "children": [] }, { - "id": 18, + "id": 3, "label": "text", "bbox": { - "l": 307.16, - "t": 474.71, - "r": 369.73, - "b": 488.43, + "l": 623.33, + "t": 392.0, + "r": 670.33, + "b": 408.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 2, @@ -835,36 +985,36 @@ "a": 255 }, "rect": { - "r_x0": 307.16, - "r_y0": 488.43, - "r_x1": 369.73, - "r_y1": 488.43, - "r_x2": 369.73, - "r_y2": 474.71, - "r_x3": 307.16, - "r_y3": 474.71, + "r_x0": 670.33, + "r_y0": 392.0, + "r_x1": 623.33, + "r_y1": 392.0, + "r_x2": 623.33, + "r_y2": 408.0, + "r_x3": 670.33, + "r_y3": 408.0, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 19, + "id": 4, "label": "text", "bbox": { - "l": 641.33, - "t": 407.21, - "r": 718.47, - "b": 420.93, + "l": 623.33, + "t": 312.0, + "r": 670.33, + "b": 328.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 3, @@ -875,36 +1025,36 @@ "a": 255 }, "rect": { - "r_x0": 641.33, - "r_y0": 420.93, - "r_x1": 718.47, - "r_y1": 420.93, - "r_x2": 718.47, - "r_y2": 407.21, - "r_x3": 641.33, - "r_y3": 407.21, + "r_x0": 670.33, + "r_y0": 312.0, + "r_x1": 623.33, + "r_y1": 312.0, + "r_x2": 623.33, + "r_y2": 328.0, + "r_x3": 670.33, + "r_y3": 328.0, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 20, + "id": 5, "label": "text", "bbox": { - "l": 531.29, - "t": 407.21, - "r": 600.35, - "b": 420.93, + "l": 428.33, + "t": 485.67, + "r": 559.67, + "b": 506.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 92.0, "cells": [ { "index": 4, @@ -915,36 +1065,36 @@ "a": 255 }, "rect": { - "r_x0": 531.29, - "r_y0": 420.93, - "r_x1": 600.35, - "r_y1": 420.93, - "r_x2": 600.35, - "r_y2": 407.21, - "r_x3": 531.29, - "r_y3": 407.21, + "r_x0": 559.67, + "r_y0": 485.67, + "r_x1": 428.33, + "r_y1": 485.67, + "r_x2": 428.33, + "r_y2": 506.33, + "r_x3": 559.67, + "r_y3": 506.33, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true } ], "children": [] }, { - "id": 21, + "id": 6, "label": "text", "bbox": { - "l": 410.9, - "t": 407.21, - "r": 494.6, - "b": 420.93, + "l": 456.0, + "t": 459.0, + "r": 526.67, + "b": 475.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 5, @@ -955,36 +1105,36 @@ "a": 255 }, "rect": { - "r_x0": 410.9, - "r_y0": 420.93, - "r_x1": 494.6, - "r_y1": 420.93, - "r_x2": 494.6, - "r_y2": 407.21, - "r_x3": 410.9, - "r_y3": 407.21, + "r_x0": 526.67, + "r_y0": 459.0, + "r_x1": 456.0, + "r_y1": 459.0, + "r_x2": 456.0, + "r_y2": 475.0, + "r_x3": 526.67, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 22, + "id": 7, "label": "text", "bbox": { - "l": 326.21, - "t": 407.21, - "r": 350.6, - "b": 420.93, + "l": 442.33, + "t": 408.0, + "r": 545.0, + "b": 424.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 91.0, "cells": [ { "index": 6, @@ -995,36 +1145,36 @@ "a": 255 }, "rect": { - "r_x0": 326.21, - "r_y0": 420.93, - "r_x1": 350.6, - "r_y1": 420.93, - "r_x2": 350.6, - "r_y2": 407.21, - "r_x3": 326.21, - "r_y3": 407.21, + "r_x0": 545.0, + "r_y0": 408.0, + "r_x1": 442.33, + "r_y1": 408.0, + "r_x2": 442.33, + "r_y2": 424.0, + "r_x3": 545.0, + "r_y3": 424.0, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 91.0, + "from_ocr": true } ], "children": [] }, { - "id": 23, + "id": 8, "label": "text", "bbox": { - "l": 647.54, - "t": 338.59, - "r": 711.72, - "b": 352.3, + "l": 468.0, + "t": 376.0, + "r": 515.0, + "b": 392.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 7, @@ -1035,36 +1185,36 @@ "a": 255 }, "rect": { - "r_x0": 647.54, - "r_y0": 352.3, - "r_x1": 711.72, - "r_y1": 352.3, - "r_x2": 711.72, - "r_y2": 338.59, - "r_x3": 647.54, - "r_y3": 338.59, + "r_x0": 515.0, + "r_y0": 376.0, + "r_x1": 468.0, + "r_y1": 376.0, + "r_x2": 468.0, + "r_y2": 392.0, + "r_x3": 515.0, + "r_y3": 392.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 24, + "id": 9, "label": "text", "bbox": { - "l": 435.41, - "t": 338.59, - "r": 468.73, - "b": 352.3, + "l": 442.33, + "t": 328.0, + "r": 545.0, + "b": 344.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 8, @@ -1075,36 +1225,36 @@ "a": 255 }, "rect": { - "r_x0": 435.41, - "r_y0": 352.3, - "r_x1": 468.73, - "r_y1": 352.3, - "r_x2": 468.73, - "r_y2": 338.59, - "r_x3": 435.41, - "r_y3": 338.59, + "r_x0": 545.0, + "r_y0": 328.0, + "r_x1": 442.33, + "r_y1": 328.0, + "r_x2": 442.33, + "r_y2": 344.0, + "r_x3": 545.0, + "r_y3": 344.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 25, + "id": 10, "label": "text", "bbox": { - "l": 323.39, - "t": 338.59, - "r": 355.1, - "b": 352.3, + "l": 468.0, + "t": 296.67, + "r": 515.0, + "b": 312.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 9, @@ -1115,36 +1265,36 @@ "a": 255 }, "rect": { - "r_x0": 323.39, - "r_y0": 352.3, - "r_x1": 355.1, - "r_y1": 352.3, - "r_x2": 355.1, - "r_y2": 338.59, - "r_x3": 323.39, - "r_y3": 338.59, + "r_x0": 515.0, + "r_y0": 296.67, + "r_x1": 468.0, + "r_y1": 296.67, + "r_x2": 468.0, + "r_y2": 312.67, + "r_x3": 515.0, + "r_y3": 312.67, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true } ], "children": [] }, { - "id": 26, + "id": 11, "label": "text", "bbox": { - "l": 634.24, - "t": 265.46, - "r": 725.22, - "b": 279.18, + "l": 274.0, + "t": 490.33, + "r": 385.67, + "b": 506.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 10, @@ -1155,36 +1305,36 @@ "a": 255 }, "rect": { - "r_x0": 634.24, - "r_y0": 279.18, - "r_x1": 725.22, - "r_y1": 279.18, - "r_x2": 725.22, - "r_y2": 265.46, - "r_x3": 634.24, - "r_y3": 265.46, + "r_x0": 385.67, + "r_y0": 490.33, + "r_x1": 274.0, + "r_y1": 490.33, + "r_x2": 274.0, + "r_y2": 506.33, + "r_x3": 385.67, + "r_y3": 506.33, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true } ], "children": [] }, { - "id": 27, + "id": 12, "label": "text", "bbox": { - "l": 542.27, - "t": 265.46, - "r": 590.22, - "b": 279.18, + "l": 292.67, + "t": 459.0, + "r": 363.0, + "b": 475.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 11, @@ -1195,36 +1345,36 @@ "a": 255 }, "rect": { - "r_x0": 542.27, - "r_y0": 279.18, - "r_x1": 590.22, - "r_y1": 279.18, - "r_x2": 590.22, - "r_y2": 265.46, - "r_x3": 542.27, - "r_y3": 265.46, + "r_x0": 363.0, + "r_y0": 459.0, + "r_x1": 292.67, + "r_y1": 459.0, + "r_x2": 292.67, + "r_y2": 475.0, + "r_x3": 363.0, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 28, + "id": 13, "label": "text", "bbox": { - "l": 319.15, - "t": 265.46, - "r": 357.35, - "b": 279.18, + "l": 278.0, + "t": 408.0, + "r": 383.67, + "b": 424.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 12, @@ -1235,21 +1385,141 @@ "a": 255 }, "rect": { - "r_x0": 319.15, - "r_y0": 279.18, - "r_x1": 357.35, - "r_y1": 279.18, - "r_x2": 357.35, - "r_y2": 265.46, - "r_x3": 319.15, - "r_y3": 265.46, + "r_x0": 383.67, + "r_y0": 408.0, + "r_x1": 278.0, + "r_y1": 408.0, + "r_x2": 278.0, + "r_y2": 424.0, + "r_x3": 383.67, + "r_y3": 424.0, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 14, + "label": "text", + "bbox": { + "l": 304.33, + "t": 376.0, + "r": 351.33, + "b": 392.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 351.33, + "r_y0": 376.0, + "r_x1": 304.33, + "r_y1": 376.0, + "r_x2": 304.33, + "r_y2": 392.0, + "r_x3": 351.33, + "r_y3": 392.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 15, + "label": "text", + "bbox": { + "l": 278.0, + "t": 328.0, + "r": 383.67, + "b": 344.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 383.67, + "r_y0": 328.0, + "r_x1": 278.0, + "r_y1": 328.0, + "r_x2": 278.0, + "r_y2": 344.0, + "r_x3": 383.67, + "r_y3": 344.0, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 16, + "label": "text", + "bbox": { + "l": 304.33, + "t": 296.67, + "r": 351.33, + "b": 312.67, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 351.33, + "r_y0": 296.67, + "r_x1": 304.33, + "r_y1": 296.67, + "r_x2": 304.33, + "r_y2": 312.67, + "r_x3": 351.33, + "r_y3": 312.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "children": [] @@ -1268,13 +1538,13 @@ "id": 0, "label": "table", "bbox": { - "l": 280.59, - "t": 233.73, - "r": 738.57, - "b": 519.09, + "l": 240.9, + "t": 277.42, + "r": 722.95, + "b": 524.35, "coord_origin": "TOPLEFT" }, - "confidence": 0.955, + "confidence": 0.979, "cells": [ { "index": 0, @@ -1285,21 +1555,21 @@ "a": 255 }, "rect": { - "r_x0": 534.41, - "r_y0": 488.43, - "r_x1": 596.97, - "r_y1": 488.43, - "r_x2": 596.97, - "r_y2": 474.71, - "r_x3": 534.41, - "r_y3": 474.71, + "r_x0": 694.67, + "r_y0": 485.67, + "r_x1": 602.0, + "r_y1": 485.67, + "r_x2": 602.0, + "r_y2": 506.33, + "r_x3": 694.67, + "r_y3": 506.33, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true }, { "index": 1, @@ -1310,21 +1580,21 @@ "a": 255 }, "rect": { - "r_x0": 420.78, - "r_y0": 488.43, - "r_x1": 483.35, - "r_y1": 488.43, - "r_x2": 483.35, - "r_y2": 474.71, - "r_x3": 420.78, - "r_y3": 474.71, + "r_x0": 680.0, + "r_y0": 454.33, + "r_x1": 610.0, + "r_y1": 454.33, + "r_x2": 610.0, + "r_y2": 475.0, + "r_x3": 680.0, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true }, { "index": 2, @@ -1335,21 +1605,21 @@ "a": 255 }, "rect": { - "r_x0": 307.16, - "r_y0": 488.43, - "r_x1": 369.73, - "r_y1": 488.43, - "r_x2": 369.73, - "r_y2": 474.71, - "r_x3": 307.16, - "r_y3": 474.71, + "r_x0": 670.33, + "r_y0": 392.0, + "r_x1": 623.33, + "r_y1": 392.0, + "r_x2": 623.33, + "r_y2": 408.0, + "r_x3": 670.33, + "r_y3": 408.0, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 3, @@ -1360,21 +1630,21 @@ "a": 255 }, "rect": { - "r_x0": 641.33, - "r_y0": 420.93, - "r_x1": 718.47, - "r_y1": 420.93, - "r_x2": 718.47, - "r_y2": 407.21, - "r_x3": 641.33, - "r_y3": 407.21, + "r_x0": 670.33, + "r_y0": 312.0, + "r_x1": 623.33, + "r_y1": 312.0, + "r_x2": 623.33, + "r_y2": 328.0, + "r_x3": 670.33, + "r_y3": 328.0, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 4, @@ -1385,21 +1655,21 @@ "a": 255 }, "rect": { - "r_x0": 531.29, - "r_y0": 420.93, - "r_x1": 600.35, - "r_y1": 420.93, - "r_x2": 600.35, - "r_y2": 407.21, - "r_x3": 531.29, - "r_y3": 407.21, + "r_x0": 559.67, + "r_y0": 485.67, + "r_x1": 428.33, + "r_y1": 485.67, + "r_x2": 428.33, + "r_y2": 506.33, + "r_x3": 559.67, + "r_y3": 506.33, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 5, @@ -1410,21 +1680,21 @@ "a": 255 }, "rect": { - "r_x0": 410.9, - "r_y0": 420.93, - "r_x1": 494.6, - "r_y1": 420.93, - "r_x2": 494.6, - "r_y2": 407.21, - "r_x3": 410.9, - "r_y3": 407.21, + "r_x0": 526.67, + "r_y0": 459.0, + "r_x1": 456.0, + "r_y1": 459.0, + "r_x2": 456.0, + "r_y2": 475.0, + "r_x3": 526.67, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 6, @@ -1435,21 +1705,21 @@ "a": 255 }, "rect": { - "r_x0": 326.21, - "r_y0": 420.93, - "r_x1": 350.6, - "r_y1": 420.93, - "r_x2": 350.6, - "r_y2": 407.21, - "r_x3": 326.21, - "r_y3": 407.21, + "r_x0": 545.0, + "r_y0": 408.0, + "r_x1": 442.33, + "r_y1": 408.0, + "r_x2": 442.33, + "r_y2": 424.0, + "r_x3": 545.0, + "r_y3": 424.0, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 91.0, + "from_ocr": true }, { "index": 7, @@ -1460,21 +1730,21 @@ "a": 255 }, "rect": { - "r_x0": 647.54, - "r_y0": 352.3, - "r_x1": 711.72, - "r_y1": 352.3, - "r_x2": 711.72, - "r_y2": 338.59, - "r_x3": 647.54, - "r_y3": 338.59, + "r_x0": 515.0, + "r_y0": 376.0, + "r_x1": 468.0, + "r_y1": 376.0, + "r_x2": 468.0, + "r_y2": 392.0, + "r_x3": 515.0, + "r_y3": 392.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 8, @@ -1485,21 +1755,21 @@ "a": 255 }, "rect": { - "r_x0": 435.41, - "r_y0": 352.3, - "r_x1": 468.73, - "r_y1": 352.3, - "r_x2": 468.73, - "r_y2": 338.59, - "r_x3": 435.41, - "r_y3": 338.59, + "r_x0": 545.0, + "r_y0": 328.0, + "r_x1": 442.33, + "r_y1": 328.0, + "r_x2": 442.33, + "r_y2": 344.0, + "r_x3": 545.0, + "r_y3": 344.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 9, @@ -1510,21 +1780,21 @@ "a": 255 }, "rect": { - "r_x0": 323.39, - "r_y0": 352.3, - "r_x1": 355.1, - "r_y1": 352.3, - "r_x2": 355.1, - "r_y2": 338.59, - "r_x3": 323.39, - "r_y3": 338.59, + "r_x0": 515.0, + "r_y0": 296.67, + "r_x1": 468.0, + "r_y1": 296.67, + "r_x2": 468.0, + "r_y2": 312.67, + "r_x3": 515.0, + "r_y3": 312.67, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 10, @@ -1535,21 +1805,21 @@ "a": 255 }, "rect": { - "r_x0": 634.24, - "r_y0": 279.18, - "r_x1": 725.22, - "r_y1": 279.18, - "r_x2": 725.22, - "r_y2": 265.46, - "r_x3": 634.24, - "r_y3": 265.46, + "r_x0": 385.67, + "r_y0": 490.33, + "r_x1": 274.0, + "r_y1": 490.33, + "r_x2": 274.0, + "r_y2": 506.33, + "r_x3": 385.67, + "r_y3": 506.33, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 11, @@ -1560,21 +1830,21 @@ "a": 255 }, "rect": { - "r_x0": 542.27, - "r_y0": 279.18, - "r_x1": 590.22, - "r_y1": 279.18, - "r_x2": 590.22, - "r_y2": 265.46, - "r_x3": 542.27, - "r_y3": 265.46, + "r_x0": 363.0, + "r_y0": 459.0, + "r_x1": 292.67, + "r_y1": 459.0, + "r_x2": 292.67, + "r_y2": 475.0, + "r_x3": 363.0, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 12, @@ -1585,35 +1855,110 @@ "a": 255 }, "rect": { - "r_x0": 319.15, - "r_y0": 279.18, - "r_x1": 357.35, - "r_y1": 279.18, - "r_x2": 357.35, - "r_y2": 265.46, - "r_x3": 319.15, - "r_y3": 265.46, + "r_x0": 383.67, + "r_y0": 408.0, + "r_x1": 278.0, + "r_y1": 408.0, + "r_x2": 278.0, + "r_y2": 424.0, + "r_x3": 383.67, + "r_y3": 424.0, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true + }, + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 351.33, + "r_y0": 376.0, + "r_x1": 304.33, + "r_y1": 376.0, + "r_x2": 304.33, + "r_y2": 392.0, + "r_x3": 351.33, + "r_y3": 392.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + }, + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 383.67, + "r_y0": 328.0, + "r_x1": 278.0, + "r_y1": 328.0, + "r_x2": 278.0, + "r_y2": 344.0, + "r_x3": 383.67, + "r_y3": 344.0, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + }, + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 351.33, + "r_y0": 296.67, + "r_x1": 304.33, + "r_y1": 296.67, + "r_x2": 304.33, + "r_y2": 312.67, + "r_x3": 351.33, + "r_y3": 312.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "children": [ { - "id": 16, + "id": 1, "label": "text", "bbox": { - "l": 534.41, - "t": 474.71, - "r": 596.97, - "b": 488.43, + "l": 602.0, + "t": 485.67, + "r": 694.67, + "b": 506.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 90.0, "cells": [ { "index": 0, @@ -1624,36 +1969,36 @@ "a": 255 }, "rect": { - "r_x0": 534.41, - "r_y0": 488.43, - "r_x1": 596.97, - "r_y1": 488.43, - "r_x2": 596.97, - "r_y2": 474.71, - "r_x3": 534.41, - "r_y3": 474.71, + "r_x0": 694.67, + "r_y0": 485.67, + "r_x1": 602.0, + "r_y1": 485.67, + "r_x2": 602.0, + "r_y2": 506.33, + "r_x3": 694.67, + "r_y3": 506.33, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true } ], "children": [] }, { - "id": 17, + "id": 2, "label": "text", "bbox": { - "l": 420.78, - "t": 474.71, - "r": 483.35, - "b": 488.43, + "l": 610.0, + "t": 454.33, + "r": 680.0, + "b": 475.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 90.0, "cells": [ { "index": 1, @@ -1664,36 +2009,36 @@ "a": 255 }, "rect": { - "r_x0": 420.78, - "r_y0": 488.43, - "r_x1": 483.35, - "r_y1": 488.43, - "r_x2": 483.35, - "r_y2": 474.71, - "r_x3": 420.78, - "r_y3": 474.71, + "r_x0": 680.0, + "r_y0": 454.33, + "r_x1": 610.0, + "r_y1": 454.33, + "r_x2": 610.0, + "r_y2": 475.0, + "r_x3": 680.0, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true } ], "children": [] }, { - "id": 18, + "id": 3, "label": "text", "bbox": { - "l": 307.16, - "t": 474.71, - "r": 369.73, - "b": 488.43, + "l": 623.33, + "t": 392.0, + "r": 670.33, + "b": 408.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 2, @@ -1704,36 +2049,36 @@ "a": 255 }, "rect": { - "r_x0": 307.16, - "r_y0": 488.43, - "r_x1": 369.73, - "r_y1": 488.43, - "r_x2": 369.73, - "r_y2": 474.71, - "r_x3": 307.16, - "r_y3": 474.71, + "r_x0": 670.33, + "r_y0": 392.0, + "r_x1": 623.33, + "r_y1": 392.0, + "r_x2": 623.33, + "r_y2": 408.0, + "r_x3": 670.33, + "r_y3": 408.0, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 19, + "id": 4, "label": "text", "bbox": { - "l": 641.33, - "t": 407.21, - "r": 718.47, - "b": 420.93, + "l": 623.33, + "t": 312.0, + "r": 670.33, + "b": 328.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 3, @@ -1744,36 +2089,36 @@ "a": 255 }, "rect": { - "r_x0": 641.33, - "r_y0": 420.93, - "r_x1": 718.47, - "r_y1": 420.93, - "r_x2": 718.47, - "r_y2": 407.21, - "r_x3": 641.33, - "r_y3": 407.21, + "r_x0": 670.33, + "r_y0": 312.0, + "r_x1": 623.33, + "r_y1": 312.0, + "r_x2": 623.33, + "r_y2": 328.0, + "r_x3": 670.33, + "r_y3": 328.0, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 20, + "id": 5, "label": "text", "bbox": { - "l": 531.29, - "t": 407.21, - "r": 600.35, - "b": 420.93, + "l": 428.33, + "t": 485.67, + "r": 559.67, + "b": 506.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 92.0, "cells": [ { "index": 4, @@ -1784,36 +2129,36 @@ "a": 255 }, "rect": { - "r_x0": 531.29, - "r_y0": 420.93, - "r_x1": 600.35, - "r_y1": 420.93, - "r_x2": 600.35, - "r_y2": 407.21, - "r_x3": 531.29, - "r_y3": 407.21, + "r_x0": 559.67, + "r_y0": 485.67, + "r_x1": 428.33, + "r_y1": 485.67, + "r_x2": 428.33, + "r_y2": 506.33, + "r_x3": 559.67, + "r_y3": 506.33, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true } ], "children": [] }, { - "id": 21, + "id": 6, "label": "text", "bbox": { - "l": 410.9, - "t": 407.21, - "r": 494.6, - "b": 420.93, + "l": 456.0, + "t": 459.0, + "r": 526.67, + "b": 475.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 5, @@ -1824,36 +2169,36 @@ "a": 255 }, "rect": { - "r_x0": 410.9, - "r_y0": 420.93, - "r_x1": 494.6, - "r_y1": 420.93, - "r_x2": 494.6, - "r_y2": 407.21, - "r_x3": 410.9, - "r_y3": 407.21, + "r_x0": 526.67, + "r_y0": 459.0, + "r_x1": 456.0, + "r_y1": 459.0, + "r_x2": 456.0, + "r_y2": 475.0, + "r_x3": 526.67, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 22, + "id": 7, "label": "text", "bbox": { - "l": 326.21, - "t": 407.21, - "r": 350.6, - "b": 420.93, + "l": 442.33, + "t": 408.0, + "r": 545.0, + "b": 424.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 91.0, "cells": [ { "index": 6, @@ -1864,36 +2209,36 @@ "a": 255 }, "rect": { - "r_x0": 326.21, - "r_y0": 420.93, - "r_x1": 350.6, - "r_y1": 420.93, - "r_x2": 350.6, - "r_y2": 407.21, - "r_x3": 326.21, - "r_y3": 407.21, + "r_x0": 545.0, + "r_y0": 408.0, + "r_x1": 442.33, + "r_y1": 408.0, + "r_x2": 442.33, + "r_y2": 424.0, + "r_x3": 545.0, + "r_y3": 424.0, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 91.0, + "from_ocr": true } ], "children": [] }, { - "id": 23, + "id": 8, "label": "text", "bbox": { - "l": 647.54, - "t": 338.59, - "r": 711.72, - "b": 352.3, + "l": 468.0, + "t": 376.0, + "r": 515.0, + "b": 392.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 7, @@ -1904,36 +2249,36 @@ "a": 255 }, "rect": { - "r_x0": 647.54, - "r_y0": 352.3, - "r_x1": 711.72, - "r_y1": 352.3, - "r_x2": 711.72, - "r_y2": 338.59, - "r_x3": 647.54, - "r_y3": 338.59, + "r_x0": 515.0, + "r_y0": 376.0, + "r_x1": 468.0, + "r_y1": 376.0, + "r_x2": 468.0, + "r_y2": 392.0, + "r_x3": 515.0, + "r_y3": 392.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 24, + "id": 9, "label": "text", "bbox": { - "l": 435.41, - "t": 338.59, - "r": 468.73, - "b": 352.3, + "l": 442.33, + "t": 328.0, + "r": 545.0, + "b": 344.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 8, @@ -1944,36 +2289,36 @@ "a": 255 }, "rect": { - "r_x0": 435.41, - "r_y0": 352.3, - "r_x1": 468.73, - "r_y1": 352.3, - "r_x2": 468.73, - "r_y2": 338.59, - "r_x3": 435.41, - "r_y3": 338.59, + "r_x0": 545.0, + "r_y0": 328.0, + "r_x1": 442.33, + "r_y1": 328.0, + "r_x2": 442.33, + "r_y2": 344.0, + "r_x3": 545.0, + "r_y3": 344.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 25, + "id": 10, "label": "text", "bbox": { - "l": 323.39, - "t": 338.59, - "r": 355.1, - "b": 352.3, + "l": 468.0, + "t": 296.67, + "r": 515.0, + "b": 312.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 9, @@ -1984,36 +2329,36 @@ "a": 255 }, "rect": { - "r_x0": 323.39, - "r_y0": 352.3, - "r_x1": 355.1, - "r_y1": 352.3, - "r_x2": 355.1, - "r_y2": 338.59, - "r_x3": 323.39, - "r_y3": 338.59, + "r_x0": 515.0, + "r_y0": 296.67, + "r_x1": 468.0, + "r_y1": 296.67, + "r_x2": 468.0, + "r_y2": 312.67, + "r_x3": 515.0, + "r_y3": 312.67, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true } ], "children": [] }, { - "id": 26, + "id": 11, "label": "text", "bbox": { - "l": 634.24, - "t": 265.46, - "r": 725.22, - "b": 279.18, + "l": 274.0, + "t": 490.33, + "r": 385.67, + "b": 506.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 10, @@ -2024,36 +2369,36 @@ "a": 255 }, "rect": { - "r_x0": 634.24, - "r_y0": 279.18, - "r_x1": 725.22, - "r_y1": 279.18, - "r_x2": 725.22, - "r_y2": 265.46, - "r_x3": 634.24, - "r_y3": 265.46, + "r_x0": 385.67, + "r_y0": 490.33, + "r_x1": 274.0, + "r_y1": 490.33, + "r_x2": 274.0, + "r_y2": 506.33, + "r_x3": 385.67, + "r_y3": 506.33, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true } ], "children": [] }, { - "id": 27, + "id": 12, "label": "text", "bbox": { - "l": 542.27, - "t": 265.46, - "r": 590.22, - "b": 279.18, + "l": 292.67, + "t": 459.0, + "r": 363.0, + "b": 475.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 11, @@ -2064,36 +2409,36 @@ "a": 255 }, "rect": { - "r_x0": 542.27, - "r_y0": 279.18, - "r_x1": 590.22, - "r_y1": 279.18, - "r_x2": 590.22, - "r_y2": 265.46, - "r_x3": 542.27, - "r_y3": 265.46, + "r_x0": 363.0, + "r_y0": 459.0, + "r_x1": 292.67, + "r_y1": 459.0, + "r_x2": 292.67, + "r_y2": 475.0, + "r_x3": 363.0, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 28, + "id": 13, "label": "text", "bbox": { - "l": 319.15, - "t": 265.46, - "r": 357.35, - "b": 279.18, + "l": 278.0, + "t": 408.0, + "r": 383.67, + "b": 424.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 12, @@ -2104,21 +2449,141 @@ "a": 255 }, "rect": { - "r_x0": 319.15, - "r_y0": 279.18, - "r_x1": 357.35, - "r_y1": 279.18, - "r_x2": 357.35, - "r_y2": 265.46, - "r_x3": 319.15, - "r_y3": 265.46, + "r_x0": 383.67, + "r_y0": 408.0, + "r_x1": 278.0, + "r_y1": 408.0, + "r_x2": 278.0, + "r_y2": 424.0, + "r_x3": 383.67, + "r_y3": 424.0, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 14, + "label": "text", + "bbox": { + "l": 304.33, + "t": 376.0, + "r": 351.33, + "b": 392.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 351.33, + "r_y0": 376.0, + "r_x1": 304.33, + "r_y1": 376.0, + "r_x2": 304.33, + "r_y2": 392.0, + "r_x3": 351.33, + "r_y3": 392.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 15, + "label": "text", + "bbox": { + "l": 278.0, + "t": 328.0, + "r": 383.67, + "b": 344.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 383.67, + "r_y0": 328.0, + "r_x1": 278.0, + "r_y1": 328.0, + "r_x2": 278.0, + "r_y2": 344.0, + "r_x3": 383.67, + "r_y3": 344.0, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 16, + "label": "text", + "bbox": { + "l": 304.33, + "t": 296.67, + "r": 351.33, + "b": 312.67, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 351.33, + "r_y0": 296.67, + "r_x1": 304.33, + "r_y1": 296.67, + "r_x2": 304.33, + "r_y2": 312.67, + "r_x3": 351.33, + "r_y3": 312.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "children": [] @@ -2130,261 +2595,25 @@ "ched", "ched", "ched", - "ched", "nl", "fcel", "fcel", - "ecel", - "fcel", - "nl", - "fcel", - "fcel", - "fcel", "fcel", "nl", "fcel", "fcel", "fcel", - "ecel", "nl" ], - "num_rows": 4, - "num_cols": 4, + "num_rows": 3, + "num_cols": 3, "table_cells": [ { "bbox": { - "l": 534.41, - "t": 474.71, - "r": 596.97, - "b": 488.43, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "Column 0", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 420.78, - "t": 474.71, - "r": 483.35, - "b": 488.43, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "Column 1", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 307.16, - "t": 474.71, - "r": 369.73, - "b": 488.43, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "Column 2", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 641.33, - "t": 407.21, - "r": 718.47, - "b": 420.93, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "this is row 0", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 531.29, - "t": 407.21, - "r": 600.35, - "b": 420.93, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "some cells", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 410.9, - "t": 407.21, - "r": 494.6, - "b": 420.93, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "have content", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 326.21, - "t": 407.21, - "r": 350.6, - "b": 420.93, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "and", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 647.54, - "t": 338.59, - "r": 711.72, - "b": 352.3, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "and row 1", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 435.41, - "t": 338.59, - "r": 468.73, - "b": 352.3, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "other", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 323.39, - "t": 338.59, - "r": 355.1, - "b": 352.3, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "have", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 634.24, - "t": 265.46, - "r": 725.22, - "b": 279.18, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "and last row 2", - "column_header": true, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 542.27, - "t": 265.46, - "r": 590.22, - "b": 279.18, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "nothing", - "column_header": true, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 319.15, - "t": 265.46, - "r": 357.35, - "b": 279.18, + "l": 97.33, + "t": 105.67, + "r": 190.0, + "b": 126.33, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -2393,10 +2622,162 @@ "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, - "text": "inside", + "text": "Vertically merged", "column_header": true, "row_header": false, "row_section": false + }, + { + "bbox": { + "l": 121.67, + "t": 204.0, + "r": 168.67, + "b": 220.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 0, + "end_col_offset_idx": 1, + "text": "value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 121.67, + "t": 284.0, + "r": 168.67, + "b": 300.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 2, + "end_row_offset_idx": 3, + "start_col_offset_idx": 0, + "end_col_offset_idx": 1, + "text": "value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 232.33, + "t": 105.67, + "r": 363.67, + "b": 126.33, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Other merged column", + "column_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 247.0, + "t": 188.0, + "r": 349.67, + "b": 204.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Some other value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 247.0, + "t": 268.0, + "r": 349.67, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 2, + "end_row_offset_idx": 3, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Some other value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 406.33, + "t": 105.67, + "r": 518.0, + "b": 121.67, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another column", + "column_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 408.33, + "t": 188.0, + "r": 514.0, + "b": 204.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 408.33, + "t": 268.0, + "r": 514.0, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 2, + "end_row_offset_idx": 3, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another value", + "column_header": false, + "row_header": false, + "row_section": false } ] } @@ -2416,13 +2797,13 @@ "id": 0, "label": "table", "bbox": { - "l": 280.59, - "t": 233.73, - "r": 738.57, - "b": 519.09, + "l": 240.9, + "t": 277.42, + "r": 722.95, + "b": 524.35, "coord_origin": "TOPLEFT" }, - "confidence": 0.955, + "confidence": 0.979, "cells": [ { "index": 0, @@ -2433,21 +2814,21 @@ "a": 255 }, "rect": { - "r_x0": 534.41, - "r_y0": 488.43, - "r_x1": 596.97, - "r_y1": 488.43, - "r_x2": 596.97, - "r_y2": 474.71, - "r_x3": 534.41, - "r_y3": 474.71, + "r_x0": 694.67, + "r_y0": 485.67, + "r_x1": 602.0, + "r_y1": 485.67, + "r_x2": 602.0, + "r_y2": 506.33, + "r_x3": 694.67, + "r_y3": 506.33, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true }, { "index": 1, @@ -2458,21 +2839,21 @@ "a": 255 }, "rect": { - "r_x0": 420.78, - "r_y0": 488.43, - "r_x1": 483.35, - "r_y1": 488.43, - "r_x2": 483.35, - "r_y2": 474.71, - "r_x3": 420.78, - "r_y3": 474.71, + "r_x0": 680.0, + "r_y0": 454.33, + "r_x1": 610.0, + "r_y1": 454.33, + "r_x2": 610.0, + "r_y2": 475.0, + "r_x3": 680.0, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true }, { "index": 2, @@ -2483,21 +2864,21 @@ "a": 255 }, "rect": { - "r_x0": 307.16, - "r_y0": 488.43, - "r_x1": 369.73, - "r_y1": 488.43, - "r_x2": 369.73, - "r_y2": 474.71, - "r_x3": 307.16, - "r_y3": 474.71, + "r_x0": 670.33, + "r_y0": 392.0, + "r_x1": 623.33, + "r_y1": 392.0, + "r_x2": 623.33, + "r_y2": 408.0, + "r_x3": 670.33, + "r_y3": 408.0, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 3, @@ -2508,21 +2889,21 @@ "a": 255 }, "rect": { - "r_x0": 641.33, - "r_y0": 420.93, - "r_x1": 718.47, - "r_y1": 420.93, - "r_x2": 718.47, - "r_y2": 407.21, - "r_x3": 641.33, - "r_y3": 407.21, + "r_x0": 670.33, + "r_y0": 312.0, + "r_x1": 623.33, + "r_y1": 312.0, + "r_x2": 623.33, + "r_y2": 328.0, + "r_x3": 670.33, + "r_y3": 328.0, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 4, @@ -2533,21 +2914,21 @@ "a": 255 }, "rect": { - "r_x0": 531.29, - "r_y0": 420.93, - "r_x1": 600.35, - "r_y1": 420.93, - "r_x2": 600.35, - "r_y2": 407.21, - "r_x3": 531.29, - "r_y3": 407.21, + "r_x0": 559.67, + "r_y0": 485.67, + "r_x1": 428.33, + "r_y1": 485.67, + "r_x2": 428.33, + "r_y2": 506.33, + "r_x3": 559.67, + "r_y3": 506.33, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 5, @@ -2558,21 +2939,21 @@ "a": 255 }, "rect": { - "r_x0": 410.9, - "r_y0": 420.93, - "r_x1": 494.6, - "r_y1": 420.93, - "r_x2": 494.6, - "r_y2": 407.21, - "r_x3": 410.9, - "r_y3": 407.21, + "r_x0": 526.67, + "r_y0": 459.0, + "r_x1": 456.0, + "r_y1": 459.0, + "r_x2": 456.0, + "r_y2": 475.0, + "r_x3": 526.67, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 6, @@ -2583,21 +2964,21 @@ "a": 255 }, "rect": { - "r_x0": 326.21, - "r_y0": 420.93, - "r_x1": 350.6, - "r_y1": 420.93, - "r_x2": 350.6, - "r_y2": 407.21, - "r_x3": 326.21, - "r_y3": 407.21, + "r_x0": 545.0, + "r_y0": 408.0, + "r_x1": 442.33, + "r_y1": 408.0, + "r_x2": 442.33, + "r_y2": 424.0, + "r_x3": 545.0, + "r_y3": 424.0, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 91.0, + "from_ocr": true }, { "index": 7, @@ -2608,21 +2989,21 @@ "a": 255 }, "rect": { - "r_x0": 647.54, - "r_y0": 352.3, - "r_x1": 711.72, - "r_y1": 352.3, - "r_x2": 711.72, - "r_y2": 338.59, - "r_x3": 647.54, - "r_y3": 338.59, + "r_x0": 515.0, + "r_y0": 376.0, + "r_x1": 468.0, + "r_y1": 376.0, + "r_x2": 468.0, + "r_y2": 392.0, + "r_x3": 515.0, + "r_y3": 392.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 8, @@ -2633,21 +3014,21 @@ "a": 255 }, "rect": { - "r_x0": 435.41, - "r_y0": 352.3, - "r_x1": 468.73, - "r_y1": 352.3, - "r_x2": 468.73, - "r_y2": 338.59, - "r_x3": 435.41, - "r_y3": 338.59, + "r_x0": 545.0, + "r_y0": 328.0, + "r_x1": 442.33, + "r_y1": 328.0, + "r_x2": 442.33, + "r_y2": 344.0, + "r_x3": 545.0, + "r_y3": 344.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 9, @@ -2658,21 +3039,21 @@ "a": 255 }, "rect": { - "r_x0": 323.39, - "r_y0": 352.3, - "r_x1": 355.1, - "r_y1": 352.3, - "r_x2": 355.1, - "r_y2": 338.59, - "r_x3": 323.39, - "r_y3": 338.59, + "r_x0": 515.0, + "r_y0": 296.67, + "r_x1": 468.0, + "r_y1": 296.67, + "r_x2": 468.0, + "r_y2": 312.67, + "r_x3": 515.0, + "r_y3": 312.67, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 10, @@ -2683,21 +3064,21 @@ "a": 255 }, "rect": { - "r_x0": 634.24, - "r_y0": 279.18, - "r_x1": 725.22, - "r_y1": 279.18, - "r_x2": 725.22, - "r_y2": 265.46, - "r_x3": 634.24, - "r_y3": 265.46, + "r_x0": 385.67, + "r_y0": 490.33, + "r_x1": 274.0, + "r_y1": 490.33, + "r_x2": 274.0, + "r_y2": 506.33, + "r_x3": 385.67, + "r_y3": 506.33, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 11, @@ -2708,21 +3089,21 @@ "a": 255 }, "rect": { - "r_x0": 542.27, - "r_y0": 279.18, - "r_x1": 590.22, - "r_y1": 279.18, - "r_x2": 590.22, - "r_y2": 265.46, - "r_x3": 542.27, - "r_y3": 265.46, + "r_x0": 363.0, + "r_y0": 459.0, + "r_x1": 292.67, + "r_y1": 459.0, + "r_x2": 292.67, + "r_y2": 475.0, + "r_x3": 363.0, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 12, @@ -2733,35 +3114,110 @@ "a": 255 }, "rect": { - "r_x0": 319.15, - "r_y0": 279.18, - "r_x1": 357.35, - "r_y1": 279.18, - "r_x2": 357.35, - "r_y2": 265.46, - "r_x3": 319.15, - "r_y3": 265.46, + "r_x0": 383.67, + "r_y0": 408.0, + "r_x1": 278.0, + "r_y1": 408.0, + "r_x2": 278.0, + "r_y2": 424.0, + "r_x3": 383.67, + "r_y3": 424.0, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true + }, + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 351.33, + "r_y0": 376.0, + "r_x1": 304.33, + "r_y1": 376.0, + "r_x2": 304.33, + "r_y2": 392.0, + "r_x3": 351.33, + "r_y3": 392.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + }, + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 383.67, + "r_y0": 328.0, + "r_x1": 278.0, + "r_y1": 328.0, + "r_x2": 278.0, + "r_y2": 344.0, + "r_x3": 383.67, + "r_y3": 344.0, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + }, + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 351.33, + "r_y0": 296.67, + "r_x1": 304.33, + "r_y1": 296.67, + "r_x2": 304.33, + "r_y2": 312.67, + "r_x3": 351.33, + "r_y3": 312.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "children": [ { - "id": 16, + "id": 1, "label": "text", "bbox": { - "l": 534.41, - "t": 474.71, - "r": 596.97, - "b": 488.43, + "l": 602.0, + "t": 485.67, + "r": 694.67, + "b": 506.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 90.0, "cells": [ { "index": 0, @@ -2772,36 +3228,36 @@ "a": 255 }, "rect": { - "r_x0": 534.41, - "r_y0": 488.43, - "r_x1": 596.97, - "r_y1": 488.43, - "r_x2": 596.97, - "r_y2": 474.71, - "r_x3": 534.41, - "r_y3": 474.71, + "r_x0": 694.67, + "r_y0": 485.67, + "r_x1": 602.0, + "r_y1": 485.67, + "r_x2": 602.0, + "r_y2": 506.33, + "r_x3": 694.67, + "r_y3": 506.33, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true } ], "children": [] }, { - "id": 17, + "id": 2, "label": "text", "bbox": { - "l": 420.78, - "t": 474.71, - "r": 483.35, - "b": 488.43, + "l": 610.0, + "t": 454.33, + "r": 680.0, + "b": 475.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 90.0, "cells": [ { "index": 1, @@ -2812,36 +3268,36 @@ "a": 255 }, "rect": { - "r_x0": 420.78, - "r_y0": 488.43, - "r_x1": 483.35, - "r_y1": 488.43, - "r_x2": 483.35, - "r_y2": 474.71, - "r_x3": 420.78, - "r_y3": 474.71, + "r_x0": 680.0, + "r_y0": 454.33, + "r_x1": 610.0, + "r_y1": 454.33, + "r_x2": 610.0, + "r_y2": 475.0, + "r_x3": 680.0, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true } ], "children": [] }, { - "id": 18, + "id": 3, "label": "text", "bbox": { - "l": 307.16, - "t": 474.71, - "r": 369.73, - "b": 488.43, + "l": 623.33, + "t": 392.0, + "r": 670.33, + "b": 408.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 2, @@ -2852,36 +3308,36 @@ "a": 255 }, "rect": { - "r_x0": 307.16, - "r_y0": 488.43, - "r_x1": 369.73, - "r_y1": 488.43, - "r_x2": 369.73, - "r_y2": 474.71, - "r_x3": 307.16, - "r_y3": 474.71, + "r_x0": 670.33, + "r_y0": 392.0, + "r_x1": 623.33, + "r_y1": 392.0, + "r_x2": 623.33, + "r_y2": 408.0, + "r_x3": 670.33, + "r_y3": 408.0, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 19, + "id": 4, "label": "text", "bbox": { - "l": 641.33, - "t": 407.21, - "r": 718.47, - "b": 420.93, + "l": 623.33, + "t": 312.0, + "r": 670.33, + "b": 328.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 3, @@ -2892,36 +3348,36 @@ "a": 255 }, "rect": { - "r_x0": 641.33, - "r_y0": 420.93, - "r_x1": 718.47, - "r_y1": 420.93, - "r_x2": 718.47, - "r_y2": 407.21, - "r_x3": 641.33, - "r_y3": 407.21, + "r_x0": 670.33, + "r_y0": 312.0, + "r_x1": 623.33, + "r_y1": 312.0, + "r_x2": 623.33, + "r_y2": 328.0, + "r_x3": 670.33, + "r_y3": 328.0, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 20, + "id": 5, "label": "text", "bbox": { - "l": 531.29, - "t": 407.21, - "r": 600.35, - "b": 420.93, + "l": 428.33, + "t": 485.67, + "r": 559.67, + "b": 506.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 92.0, "cells": [ { "index": 4, @@ -2932,36 +3388,36 @@ "a": 255 }, "rect": { - "r_x0": 531.29, - "r_y0": 420.93, - "r_x1": 600.35, - "r_y1": 420.93, - "r_x2": 600.35, - "r_y2": 407.21, - "r_x3": 531.29, - "r_y3": 407.21, + "r_x0": 559.67, + "r_y0": 485.67, + "r_x1": 428.33, + "r_y1": 485.67, + "r_x2": 428.33, + "r_y2": 506.33, + "r_x3": 559.67, + "r_y3": 506.33, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true } ], "children": [] }, { - "id": 21, + "id": 6, "label": "text", "bbox": { - "l": 410.9, - "t": 407.21, - "r": 494.6, - "b": 420.93, + "l": 456.0, + "t": 459.0, + "r": 526.67, + "b": 475.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 5, @@ -2972,36 +3428,36 @@ "a": 255 }, "rect": { - "r_x0": 410.9, - "r_y0": 420.93, - "r_x1": 494.6, - "r_y1": 420.93, - "r_x2": 494.6, - "r_y2": 407.21, - "r_x3": 410.9, - "r_y3": 407.21, + "r_x0": 526.67, + "r_y0": 459.0, + "r_x1": 456.0, + "r_y1": 459.0, + "r_x2": 456.0, + "r_y2": 475.0, + "r_x3": 526.67, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 22, + "id": 7, "label": "text", "bbox": { - "l": 326.21, - "t": 407.21, - "r": 350.6, - "b": 420.93, + "l": 442.33, + "t": 408.0, + "r": 545.0, + "b": 424.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 91.0, "cells": [ { "index": 6, @@ -3012,36 +3468,36 @@ "a": 255 }, "rect": { - "r_x0": 326.21, - "r_y0": 420.93, - "r_x1": 350.6, - "r_y1": 420.93, - "r_x2": 350.6, - "r_y2": 407.21, - "r_x3": 326.21, - "r_y3": 407.21, + "r_x0": 545.0, + "r_y0": 408.0, + "r_x1": 442.33, + "r_y1": 408.0, + "r_x2": 442.33, + "r_y2": 424.0, + "r_x3": 545.0, + "r_y3": 424.0, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 91.0, + "from_ocr": true } ], "children": [] }, { - "id": 23, + "id": 8, "label": "text", "bbox": { - "l": 647.54, - "t": 338.59, - "r": 711.72, - "b": 352.3, + "l": 468.0, + "t": 376.0, + "r": 515.0, + "b": 392.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 7, @@ -3052,36 +3508,36 @@ "a": 255 }, "rect": { - "r_x0": 647.54, - "r_y0": 352.3, - "r_x1": 711.72, - "r_y1": 352.3, - "r_x2": 711.72, - "r_y2": 338.59, - "r_x3": 647.54, - "r_y3": 338.59, + "r_x0": 515.0, + "r_y0": 376.0, + "r_x1": 468.0, + "r_y1": 376.0, + "r_x2": 468.0, + "r_y2": 392.0, + "r_x3": 515.0, + "r_y3": 392.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 24, + "id": 9, "label": "text", "bbox": { - "l": 435.41, - "t": 338.59, - "r": 468.73, - "b": 352.3, + "l": 442.33, + "t": 328.0, + "r": 545.0, + "b": 344.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 8, @@ -3092,36 +3548,36 @@ "a": 255 }, "rect": { - "r_x0": 435.41, - "r_y0": 352.3, - "r_x1": 468.73, - "r_y1": 352.3, - "r_x2": 468.73, - "r_y2": 338.59, - "r_x3": 435.41, - "r_y3": 338.59, + "r_x0": 545.0, + "r_y0": 328.0, + "r_x1": 442.33, + "r_y1": 328.0, + "r_x2": 442.33, + "r_y2": 344.0, + "r_x3": 545.0, + "r_y3": 344.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 25, + "id": 10, "label": "text", "bbox": { - "l": 323.39, - "t": 338.59, - "r": 355.1, - "b": 352.3, + "l": 468.0, + "t": 296.67, + "r": 515.0, + "b": 312.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 9, @@ -3132,36 +3588,36 @@ "a": 255 }, "rect": { - "r_x0": 323.39, - "r_y0": 352.3, - "r_x1": 355.1, - "r_y1": 352.3, - "r_x2": 355.1, - "r_y2": 338.59, - "r_x3": 323.39, - "r_y3": 338.59, + "r_x0": 515.0, + "r_y0": 296.67, + "r_x1": 468.0, + "r_y1": 296.67, + "r_x2": 468.0, + "r_y2": 312.67, + "r_x3": 515.0, + "r_y3": 312.67, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true } ], "children": [] }, { - "id": 26, + "id": 11, "label": "text", "bbox": { - "l": 634.24, - "t": 265.46, - "r": 725.22, - "b": 279.18, + "l": 274.0, + "t": 490.33, + "r": 385.67, + "b": 506.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 10, @@ -3172,36 +3628,36 @@ "a": 255 }, "rect": { - "r_x0": 634.24, - "r_y0": 279.18, - "r_x1": 725.22, - "r_y1": 279.18, - "r_x2": 725.22, - "r_y2": 265.46, - "r_x3": 634.24, - "r_y3": 265.46, + "r_x0": 385.67, + "r_y0": 490.33, + "r_x1": 274.0, + "r_y1": 490.33, + "r_x2": 274.0, + "r_y2": 506.33, + "r_x3": 385.67, + "r_y3": 506.33, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true } ], "children": [] }, { - "id": 27, + "id": 12, "label": "text", "bbox": { - "l": 542.27, - "t": 265.46, - "r": 590.22, - "b": 279.18, + "l": 292.67, + "t": 459.0, + "r": 363.0, + "b": 475.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 11, @@ -3212,36 +3668,36 @@ "a": 255 }, "rect": { - "r_x0": 542.27, - "r_y0": 279.18, - "r_x1": 590.22, - "r_y1": 279.18, - "r_x2": 590.22, - "r_y2": 265.46, - "r_x3": 542.27, - "r_y3": 265.46, + "r_x0": 363.0, + "r_y0": 459.0, + "r_x1": 292.67, + "r_y1": 459.0, + "r_x2": 292.67, + "r_y2": 475.0, + "r_x3": 363.0, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 28, + "id": 13, "label": "text", "bbox": { - "l": 319.15, - "t": 265.46, - "r": 357.35, - "b": 279.18, + "l": 278.0, + "t": 408.0, + "r": 383.67, + "b": 424.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 12, @@ -3252,21 +3708,141 @@ "a": 255 }, "rect": { - "r_x0": 319.15, - "r_y0": 279.18, - "r_x1": 357.35, - "r_y1": 279.18, - "r_x2": 357.35, - "r_y2": 265.46, - "r_x3": 319.15, - "r_y3": 265.46, + "r_x0": 383.67, + "r_y0": 408.0, + "r_x1": 278.0, + "r_y1": 408.0, + "r_x2": 278.0, + "r_y2": 424.0, + "r_x3": 383.67, + "r_y3": 424.0, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 14, + "label": "text", + "bbox": { + "l": 304.33, + "t": 376.0, + "r": 351.33, + "b": 392.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 351.33, + "r_y0": 376.0, + "r_x1": 304.33, + "r_y1": 376.0, + "r_x2": 304.33, + "r_y2": 392.0, + "r_x3": 351.33, + "r_y3": 392.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 15, + "label": "text", + "bbox": { + "l": 278.0, + "t": 328.0, + "r": 383.67, + "b": 344.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 383.67, + "r_y0": 328.0, + "r_x1": 278.0, + "r_y1": 328.0, + "r_x2": 278.0, + "r_y2": 344.0, + "r_x3": 383.67, + "r_y3": 344.0, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 16, + "label": "text", + "bbox": { + "l": 304.33, + "t": 296.67, + "r": 351.33, + "b": 312.67, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 351.33, + "r_y0": 296.67, + "r_x1": 304.33, + "r_y1": 296.67, + "r_x2": 304.33, + "r_y2": 312.67, + "r_x3": 351.33, + "r_y3": 312.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "children": [] @@ -3278,261 +3854,25 @@ "ched", "ched", "ched", - "ched", "nl", "fcel", "fcel", - "ecel", - "fcel", - "nl", - "fcel", - "fcel", - "fcel", "fcel", "nl", "fcel", "fcel", "fcel", - "ecel", "nl" ], - "num_rows": 4, - "num_cols": 4, + "num_rows": 3, + "num_cols": 3, "table_cells": [ { "bbox": { - "l": 534.41, - "t": 474.71, - "r": 596.97, - "b": 488.43, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "Column 0", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 420.78, - "t": 474.71, - "r": 483.35, - "b": 488.43, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "Column 1", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 307.16, - "t": 474.71, - "r": 369.73, - "b": 488.43, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "Column 2", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 641.33, - "t": 407.21, - "r": 718.47, - "b": 420.93, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "this is row 0", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 531.29, - "t": 407.21, - "r": 600.35, - "b": 420.93, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "some cells", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 410.9, - "t": 407.21, - "r": 494.6, - "b": 420.93, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "have content", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 326.21, - "t": 407.21, - "r": 350.6, - "b": 420.93, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "and", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 647.54, - "t": 338.59, - "r": 711.72, - "b": 352.3, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "and row 1", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 435.41, - "t": 338.59, - "r": 468.73, - "b": 352.3, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "other", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 323.39, - "t": 338.59, - "r": 355.1, - "b": 352.3, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "have", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 634.24, - "t": 265.46, - "r": 725.22, - "b": 279.18, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "and last row 2", - "column_header": true, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 542.27, - "t": 265.46, - "r": 590.22, - "b": 279.18, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "nothing", - "column_header": true, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 319.15, - "t": 265.46, - "r": 357.35, - "b": 279.18, + "l": 97.33, + "t": 105.67, + "r": 190.0, + "b": 126.33, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -3541,10 +3881,162 @@ "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, - "text": "inside", + "text": "Vertically merged", "column_header": true, "row_header": false, "row_section": false + }, + { + "bbox": { + "l": 121.67, + "t": 204.0, + "r": 168.67, + "b": 220.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 0, + "end_col_offset_idx": 1, + "text": "value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 121.67, + "t": 284.0, + "r": 168.67, + "b": 300.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 2, + "end_row_offset_idx": 3, + "start_col_offset_idx": 0, + "end_col_offset_idx": 1, + "text": "value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 232.33, + "t": 105.67, + "r": 363.67, + "b": 126.33, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Other merged column", + "column_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 247.0, + "t": 188.0, + "r": 349.67, + "b": 204.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Some other value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 247.0, + "t": 268.0, + "r": 349.67, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 2, + "end_row_offset_idx": 3, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Some other value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 406.33, + "t": 105.67, + "r": 518.0, + "b": 121.67, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another column", + "column_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 408.33, + "t": 188.0, + "r": 514.0, + "b": 204.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 408.33, + "t": 268.0, + "r": 514.0, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 2, + "end_row_offset_idx": 3, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another value", + "column_header": false, + "row_header": false, + "row_section": false } ] } @@ -3558,13 +4050,13 @@ "id": 0, "label": "table", "bbox": { - "l": 280.59, - "t": 233.73, - "r": 738.57, - "b": 519.09, + "l": 240.9, + "t": 277.42, + "r": 722.95, + "b": 524.35, "coord_origin": "TOPLEFT" }, - "confidence": 0.955, + "confidence": 0.979, "cells": [ { "index": 0, @@ -3575,21 +4067,21 @@ "a": 255 }, "rect": { - "r_x0": 534.41, - "r_y0": 488.43, - "r_x1": 596.97, - "r_y1": 488.43, - "r_x2": 596.97, - "r_y2": 474.71, - "r_x3": 534.41, - "r_y3": 474.71, + "r_x0": 694.67, + "r_y0": 485.67, + "r_x1": 602.0, + "r_y1": 485.67, + "r_x2": 602.0, + "r_y2": 506.33, + "r_x3": 694.67, + "r_y3": 506.33, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true }, { "index": 1, @@ -3600,21 +4092,21 @@ "a": 255 }, "rect": { - "r_x0": 420.78, - "r_y0": 488.43, - "r_x1": 483.35, - "r_y1": 488.43, - "r_x2": 483.35, - "r_y2": 474.71, - "r_x3": 420.78, - "r_y3": 474.71, + "r_x0": 680.0, + "r_y0": 454.33, + "r_x1": 610.0, + "r_y1": 454.33, + "r_x2": 610.0, + "r_y2": 475.0, + "r_x3": 680.0, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true }, { "index": 2, @@ -3625,21 +4117,21 @@ "a": 255 }, "rect": { - "r_x0": 307.16, - "r_y0": 488.43, - "r_x1": 369.73, - "r_y1": 488.43, - "r_x2": 369.73, - "r_y2": 474.71, - "r_x3": 307.16, - "r_y3": 474.71, + "r_x0": 670.33, + "r_y0": 392.0, + "r_x1": 623.33, + "r_y1": 392.0, + "r_x2": 623.33, + "r_y2": 408.0, + "r_x3": 670.33, + "r_y3": 408.0, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 3, @@ -3650,21 +4142,21 @@ "a": 255 }, "rect": { - "r_x0": 641.33, - "r_y0": 420.93, - "r_x1": 718.47, - "r_y1": 420.93, - "r_x2": 718.47, - "r_y2": 407.21, - "r_x3": 641.33, - "r_y3": 407.21, + "r_x0": 670.33, + "r_y0": 312.0, + "r_x1": 623.33, + "r_y1": 312.0, + "r_x2": 623.33, + "r_y2": 328.0, + "r_x3": 670.33, + "r_y3": 328.0, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 4, @@ -3675,21 +4167,21 @@ "a": 255 }, "rect": { - "r_x0": 531.29, - "r_y0": 420.93, - "r_x1": 600.35, - "r_y1": 420.93, - "r_x2": 600.35, - "r_y2": 407.21, - "r_x3": 531.29, - "r_y3": 407.21, + "r_x0": 559.67, + "r_y0": 485.67, + "r_x1": 428.33, + "r_y1": 485.67, + "r_x2": 428.33, + "r_y2": 506.33, + "r_x3": 559.67, + "r_y3": 506.33, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 5, @@ -3700,21 +4192,21 @@ "a": 255 }, "rect": { - "r_x0": 410.9, - "r_y0": 420.93, - "r_x1": 494.6, - "r_y1": 420.93, - "r_x2": 494.6, - "r_y2": 407.21, - "r_x3": 410.9, - "r_y3": 407.21, + "r_x0": 526.67, + "r_y0": 459.0, + "r_x1": 456.0, + "r_y1": 459.0, + "r_x2": 456.0, + "r_y2": 475.0, + "r_x3": 526.67, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 6, @@ -3725,21 +4217,21 @@ "a": 255 }, "rect": { - "r_x0": 326.21, - "r_y0": 420.93, - "r_x1": 350.6, - "r_y1": 420.93, - "r_x2": 350.6, - "r_y2": 407.21, - "r_x3": 326.21, - "r_y3": 407.21, + "r_x0": 545.0, + "r_y0": 408.0, + "r_x1": 442.33, + "r_y1": 408.0, + "r_x2": 442.33, + "r_y2": 424.0, + "r_x3": 545.0, + "r_y3": 424.0, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 91.0, + "from_ocr": true }, { "index": 7, @@ -3750,21 +4242,21 @@ "a": 255 }, "rect": { - "r_x0": 647.54, - "r_y0": 352.3, - "r_x1": 711.72, - "r_y1": 352.3, - "r_x2": 711.72, - "r_y2": 338.59, - "r_x3": 647.54, - "r_y3": 338.59, + "r_x0": 515.0, + "r_y0": 376.0, + "r_x1": 468.0, + "r_y1": 376.0, + "r_x2": 468.0, + "r_y2": 392.0, + "r_x3": 515.0, + "r_y3": 392.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 8, @@ -3775,21 +4267,21 @@ "a": 255 }, "rect": { - "r_x0": 435.41, - "r_y0": 352.3, - "r_x1": 468.73, - "r_y1": 352.3, - "r_x2": 468.73, - "r_y2": 338.59, - "r_x3": 435.41, - "r_y3": 338.59, + "r_x0": 545.0, + "r_y0": 328.0, + "r_x1": 442.33, + "r_y1": 328.0, + "r_x2": 442.33, + "r_y2": 344.0, + "r_x3": 545.0, + "r_y3": 344.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 9, @@ -3800,21 +4292,21 @@ "a": 255 }, "rect": { - "r_x0": 323.39, - "r_y0": 352.3, - "r_x1": 355.1, - "r_y1": 352.3, - "r_x2": 355.1, - "r_y2": 338.59, - "r_x3": 323.39, - "r_y3": 338.59, + "r_x0": 515.0, + "r_y0": 296.67, + "r_x1": 468.0, + "r_y1": 296.67, + "r_x2": 468.0, + "r_y2": 312.67, + "r_x3": 515.0, + "r_y3": 312.67, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 10, @@ -3825,21 +4317,21 @@ "a": 255 }, "rect": { - "r_x0": 634.24, - "r_y0": 279.18, - "r_x1": 725.22, - "r_y1": 279.18, - "r_x2": 725.22, - "r_y2": 265.46, - "r_x3": 634.24, - "r_y3": 265.46, + "r_x0": 385.67, + "r_y0": 490.33, + "r_x1": 274.0, + "r_y1": 490.33, + "r_x2": 274.0, + "r_y2": 506.33, + "r_x3": 385.67, + "r_y3": 506.33, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 11, @@ -3850,21 +4342,21 @@ "a": 255 }, "rect": { - "r_x0": 542.27, - "r_y0": 279.18, - "r_x1": 590.22, - "r_y1": 279.18, - "r_x2": 590.22, - "r_y2": 265.46, - "r_x3": 542.27, - "r_y3": 265.46, + "r_x0": 363.0, + "r_y0": 459.0, + "r_x1": 292.67, + "r_y1": 459.0, + "r_x2": 292.67, + "r_y2": 475.0, + "r_x3": 363.0, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 12, @@ -3875,35 +4367,110 @@ "a": 255 }, "rect": { - "r_x0": 319.15, - "r_y0": 279.18, - "r_x1": 357.35, - "r_y1": 279.18, - "r_x2": 357.35, - "r_y2": 265.46, - "r_x3": 319.15, - "r_y3": 265.46, + "r_x0": 383.67, + "r_y0": 408.0, + "r_x1": 278.0, + "r_y1": 408.0, + "r_x2": 278.0, + "r_y2": 424.0, + "r_x3": 383.67, + "r_y3": 424.0, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true + }, + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 351.33, + "r_y0": 376.0, + "r_x1": 304.33, + "r_y1": 376.0, + "r_x2": 304.33, + "r_y2": 392.0, + "r_x3": 351.33, + "r_y3": 392.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + }, + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 383.67, + "r_y0": 328.0, + "r_x1": 278.0, + "r_y1": 328.0, + "r_x2": 278.0, + "r_y2": 344.0, + "r_x3": 383.67, + "r_y3": 344.0, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + }, + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 351.33, + "r_y0": 296.67, + "r_x1": 304.33, + "r_y1": 296.67, + "r_x2": 304.33, + "r_y2": 312.67, + "r_x3": 351.33, + "r_y3": 312.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "children": [ { - "id": 16, + "id": 1, "label": "text", "bbox": { - "l": 534.41, - "t": 474.71, - "r": 596.97, - "b": 488.43, + "l": 602.0, + "t": 485.67, + "r": 694.67, + "b": 506.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 90.0, "cells": [ { "index": 0, @@ -3914,36 +4481,36 @@ "a": 255 }, "rect": { - "r_x0": 534.41, - "r_y0": 488.43, - "r_x1": 596.97, - "r_y1": 488.43, - "r_x2": 596.97, - "r_y2": 474.71, - "r_x3": 534.41, - "r_y3": 474.71, + "r_x0": 694.67, + "r_y0": 485.67, + "r_x1": 602.0, + "r_y1": 485.67, + "r_x2": 602.0, + "r_y2": 506.33, + "r_x3": 694.67, + "r_y3": 506.33, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true } ], "children": [] }, { - "id": 17, + "id": 2, "label": "text", "bbox": { - "l": 420.78, - "t": 474.71, - "r": 483.35, - "b": 488.43, + "l": 610.0, + "t": 454.33, + "r": 680.0, + "b": 475.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 90.0, "cells": [ { "index": 1, @@ -3954,36 +4521,36 @@ "a": 255 }, "rect": { - "r_x0": 420.78, - "r_y0": 488.43, - "r_x1": 483.35, - "r_y1": 488.43, - "r_x2": 483.35, - "r_y2": 474.71, - "r_x3": 420.78, - "r_y3": 474.71, + "r_x0": 680.0, + "r_y0": 454.33, + "r_x1": 610.0, + "r_y1": 454.33, + "r_x2": 610.0, + "r_y2": 475.0, + "r_x3": 680.0, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true } ], "children": [] }, { - "id": 18, + "id": 3, "label": "text", "bbox": { - "l": 307.16, - "t": 474.71, - "r": 369.73, - "b": 488.43, + "l": 623.33, + "t": 392.0, + "r": 670.33, + "b": 408.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 2, @@ -3994,36 +4561,36 @@ "a": 255 }, "rect": { - "r_x0": 307.16, - "r_y0": 488.43, - "r_x1": 369.73, - "r_y1": 488.43, - "r_x2": 369.73, - "r_y2": 474.71, - "r_x3": 307.16, - "r_y3": 474.71, + "r_x0": 670.33, + "r_y0": 392.0, + "r_x1": 623.33, + "r_y1": 392.0, + "r_x2": 623.33, + "r_y2": 408.0, + "r_x3": 670.33, + "r_y3": 408.0, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 19, + "id": 4, "label": "text", "bbox": { - "l": 641.33, - "t": 407.21, - "r": 718.47, - "b": 420.93, + "l": 623.33, + "t": 312.0, + "r": 670.33, + "b": 328.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 3, @@ -4034,36 +4601,36 @@ "a": 255 }, "rect": { - "r_x0": 641.33, - "r_y0": 420.93, - "r_x1": 718.47, - "r_y1": 420.93, - "r_x2": 718.47, - "r_y2": 407.21, - "r_x3": 641.33, - "r_y3": 407.21, + "r_x0": 670.33, + "r_y0": 312.0, + "r_x1": 623.33, + "r_y1": 312.0, + "r_x2": 623.33, + "r_y2": 328.0, + "r_x3": 670.33, + "r_y3": 328.0, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 20, + "id": 5, "label": "text", "bbox": { - "l": 531.29, - "t": 407.21, - "r": 600.35, - "b": 420.93, + "l": 428.33, + "t": 485.67, + "r": 559.67, + "b": 506.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 92.0, "cells": [ { "index": 4, @@ -4074,36 +4641,36 @@ "a": 255 }, "rect": { - "r_x0": 531.29, - "r_y0": 420.93, - "r_x1": 600.35, - "r_y1": 420.93, - "r_x2": 600.35, - "r_y2": 407.21, - "r_x3": 531.29, - "r_y3": 407.21, + "r_x0": 559.67, + "r_y0": 485.67, + "r_x1": 428.33, + "r_y1": 485.67, + "r_x2": 428.33, + "r_y2": 506.33, + "r_x3": 559.67, + "r_y3": 506.33, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true } ], "children": [] }, { - "id": 21, + "id": 6, "label": "text", "bbox": { - "l": 410.9, - "t": 407.21, - "r": 494.6, - "b": 420.93, + "l": 456.0, + "t": 459.0, + "r": 526.67, + "b": 475.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 5, @@ -4114,36 +4681,36 @@ "a": 255 }, "rect": { - "r_x0": 410.9, - "r_y0": 420.93, - "r_x1": 494.6, - "r_y1": 420.93, - "r_x2": 494.6, - "r_y2": 407.21, - "r_x3": 410.9, - "r_y3": 407.21, + "r_x0": 526.67, + "r_y0": 459.0, + "r_x1": 456.0, + "r_y1": 459.0, + "r_x2": 456.0, + "r_y2": 475.0, + "r_x3": 526.67, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 22, + "id": 7, "label": "text", "bbox": { - "l": 326.21, - "t": 407.21, - "r": 350.6, - "b": 420.93, + "l": 442.33, + "t": 408.0, + "r": 545.0, + "b": 424.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 91.0, "cells": [ { "index": 6, @@ -4154,36 +4721,36 @@ "a": 255 }, "rect": { - "r_x0": 326.21, - "r_y0": 420.93, - "r_x1": 350.6, - "r_y1": 420.93, - "r_x2": 350.6, - "r_y2": 407.21, - "r_x3": 326.21, - "r_y3": 407.21, + "r_x0": 545.0, + "r_y0": 408.0, + "r_x1": 442.33, + "r_y1": 408.0, + "r_x2": 442.33, + "r_y2": 424.0, + "r_x3": 545.0, + "r_y3": 424.0, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 91.0, + "from_ocr": true } ], "children": [] }, { - "id": 23, + "id": 8, "label": "text", "bbox": { - "l": 647.54, - "t": 338.59, - "r": 711.72, - "b": 352.3, + "l": 468.0, + "t": 376.0, + "r": 515.0, + "b": 392.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 7, @@ -4194,36 +4761,36 @@ "a": 255 }, "rect": { - "r_x0": 647.54, - "r_y0": 352.3, - "r_x1": 711.72, - "r_y1": 352.3, - "r_x2": 711.72, - "r_y2": 338.59, - "r_x3": 647.54, - "r_y3": 338.59, + "r_x0": 515.0, + "r_y0": 376.0, + "r_x1": 468.0, + "r_y1": 376.0, + "r_x2": 468.0, + "r_y2": 392.0, + "r_x3": 515.0, + "r_y3": 392.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 24, + "id": 9, "label": "text", "bbox": { - "l": 435.41, - "t": 338.59, - "r": 468.73, - "b": 352.3, + "l": 442.33, + "t": 328.0, + "r": 545.0, + "b": 344.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 8, @@ -4234,36 +4801,36 @@ "a": 255 }, "rect": { - "r_x0": 435.41, - "r_y0": 352.3, - "r_x1": 468.73, - "r_y1": 352.3, - "r_x2": 468.73, - "r_y2": 338.59, - "r_x3": 435.41, - "r_y3": 338.59, + "r_x0": 545.0, + "r_y0": 328.0, + "r_x1": 442.33, + "r_y1": 328.0, + "r_x2": 442.33, + "r_y2": 344.0, + "r_x3": 545.0, + "r_y3": 344.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 25, + "id": 10, "label": "text", "bbox": { - "l": 323.39, - "t": 338.59, - "r": 355.1, - "b": 352.3, + "l": 468.0, + "t": 296.67, + "r": 515.0, + "b": 312.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 9, @@ -4274,36 +4841,36 @@ "a": 255 }, "rect": { - "r_x0": 323.39, - "r_y0": 352.3, - "r_x1": 355.1, - "r_y1": 352.3, - "r_x2": 355.1, - "r_y2": 338.59, - "r_x3": 323.39, - "r_y3": 338.59, + "r_x0": 515.0, + "r_y0": 296.67, + "r_x1": 468.0, + "r_y1": 296.67, + "r_x2": 468.0, + "r_y2": 312.67, + "r_x3": 515.0, + "r_y3": 312.67, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true } ], "children": [] }, { - "id": 26, + "id": 11, "label": "text", "bbox": { - "l": 634.24, - "t": 265.46, - "r": 725.22, - "b": 279.18, + "l": 274.0, + "t": 490.33, + "r": 385.67, + "b": 506.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 10, @@ -4314,36 +4881,36 @@ "a": 255 }, "rect": { - "r_x0": 634.24, - "r_y0": 279.18, - "r_x1": 725.22, - "r_y1": 279.18, - "r_x2": 725.22, - "r_y2": 265.46, - "r_x3": 634.24, - "r_y3": 265.46, + "r_x0": 385.67, + "r_y0": 490.33, + "r_x1": 274.0, + "r_y1": 490.33, + "r_x2": 274.0, + "r_y2": 506.33, + "r_x3": 385.67, + "r_y3": 506.33, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true } ], "children": [] }, { - "id": 27, + "id": 12, "label": "text", "bbox": { - "l": 542.27, - "t": 265.46, - "r": 590.22, - "b": 279.18, + "l": 292.67, + "t": 459.0, + "r": 363.0, + "b": 475.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 11, @@ -4354,36 +4921,36 @@ "a": 255 }, "rect": { - "r_x0": 542.27, - "r_y0": 279.18, - "r_x1": 590.22, - "r_y1": 279.18, - "r_x2": 590.22, - "r_y2": 265.46, - "r_x3": 542.27, - "r_y3": 265.46, + "r_x0": 363.0, + "r_y0": 459.0, + "r_x1": 292.67, + "r_y1": 459.0, + "r_x2": 292.67, + "r_y2": 475.0, + "r_x3": 363.0, + "r_y3": 475.0, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 28, + "id": 13, "label": "text", "bbox": { - "l": 319.15, - "t": 265.46, - "r": 357.35, - "b": 279.18, + "l": 278.0, + "t": 408.0, + "r": 383.67, + "b": 424.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 12, @@ -4394,21 +4961,141 @@ "a": 255 }, "rect": { - "r_x0": 319.15, - "r_y0": 279.18, - "r_x1": 357.35, - "r_y1": 279.18, - "r_x2": 357.35, - "r_y2": 265.46, - "r_x3": 319.15, - "r_y3": 265.46, + "r_x0": 383.67, + "r_y0": 408.0, + "r_x1": 278.0, + "r_y1": 408.0, + "r_x2": 278.0, + "r_y2": 424.0, + "r_x3": 383.67, + "r_y3": 424.0, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 14, + "label": "text", + "bbox": { + "l": 304.33, + "t": 376.0, + "r": 351.33, + "b": 392.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 351.33, + "r_y0": 376.0, + "r_x1": 304.33, + "r_y1": 376.0, + "r_x2": 304.33, + "r_y2": 392.0, + "r_x3": 351.33, + "r_y3": 392.0, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 15, + "label": "text", + "bbox": { + "l": 278.0, + "t": 328.0, + "r": 383.67, + "b": 344.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 94.0, + "cells": [ + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 383.67, + "r_y0": 328.0, + "r_x1": 278.0, + "r_y1": 328.0, + "r_x2": 278.0, + "r_y2": 344.0, + "r_x3": 383.67, + "r_y3": 344.0, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 94.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 16, + "label": "text", + "bbox": { + "l": 304.33, + "t": 296.67, + "r": 351.33, + "b": 312.67, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 351.33, + "r_y0": 296.67, + "r_x1": 304.33, + "r_y1": 296.67, + "r_x2": 304.33, + "r_y2": 312.67, + "r_x3": 351.33, + "r_y3": 312.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "children": [] @@ -4420,261 +5107,25 @@ "ched", "ched", "ched", - "ched", "nl", "fcel", "fcel", - "ecel", - "fcel", - "nl", - "fcel", - "fcel", - "fcel", "fcel", "nl", "fcel", "fcel", "fcel", - "ecel", "nl" ], - "num_rows": 4, - "num_cols": 4, + "num_rows": 3, + "num_cols": 3, "table_cells": [ { "bbox": { - "l": 534.41, - "t": 474.71, - "r": 596.97, - "b": 488.43, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "Column 0", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 420.78, - "t": 474.71, - "r": 483.35, - "b": 488.43, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "Column 1", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 307.16, - "t": 474.71, - "r": 369.73, - "b": 488.43, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "Column 2", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 641.33, - "t": 407.21, - "r": 718.47, - "b": 420.93, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "this is row 0", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 531.29, - "t": 407.21, - "r": 600.35, - "b": 420.93, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "some cells", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 410.9, - "t": 407.21, - "r": 494.6, - "b": 420.93, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "have content", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 326.21, - "t": 407.21, - "r": 350.6, - "b": 420.93, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "and", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 647.54, - "t": 338.59, - "r": 711.72, - "b": 352.3, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "and row 1", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 435.41, - "t": 338.59, - "r": 468.73, - "b": 352.3, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "other", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 323.39, - "t": 338.59, - "r": 355.1, - "b": 352.3, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "have", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 634.24, - "t": 265.46, - "r": 725.22, - "b": 279.18, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "and last row 2", - "column_header": true, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 542.27, - "t": 265.46, - "r": 590.22, - "b": 279.18, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "nothing", - "column_header": true, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 319.15, - "t": 265.46, - "r": 357.35, - "b": 279.18, + "l": 97.33, + "t": 105.67, + "r": 190.0, + "b": 126.33, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -4683,10 +5134,162 @@ "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, - "text": "inside", + "text": "Vertically merged", "column_header": true, "row_header": false, "row_section": false + }, + { + "bbox": { + "l": 121.67, + "t": 204.0, + "r": 168.67, + "b": 220.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 0, + "end_col_offset_idx": 1, + "text": "value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 121.67, + "t": 284.0, + "r": 168.67, + "b": 300.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 2, + "end_row_offset_idx": 3, + "start_col_offset_idx": 0, + "end_col_offset_idx": 1, + "text": "value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 232.33, + "t": 105.67, + "r": 363.67, + "b": 126.33, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Other merged column", + "column_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 247.0, + "t": 188.0, + "r": 349.67, + "b": 204.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Some other value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 247.0, + "t": 268.0, + "r": 349.67, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 2, + "end_row_offset_idx": 3, + "start_col_offset_idx": 1, + "end_col_offset_idx": 2, + "text": "Some other value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 406.33, + "t": 105.67, + "r": 518.0, + "b": 121.67, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 0, + "end_row_offset_idx": 1, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another column", + "column_header": true, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 408.33, + "t": 188.0, + "r": 514.0, + "b": 204.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 1, + "end_row_offset_idx": 2, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another value", + "column_header": false, + "row_header": false, + "row_section": false + }, + { + "bbox": { + "l": 408.33, + "t": 268.0, + "r": 514.0, + "b": 284.0, + "coord_origin": "TOPLEFT" + }, + "row_span": 1, + "col_span": 1, + "start_row_offset_idx": 2, + "end_row_offset_idx": 3, + "start_col_offset_idx": 2, + "end_col_offset_idx": 3, + "text": "Yet another value", + "column_header": false, + "row_header": false, + "row_section": false } ] } diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_270.doctags.txt b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_270.doctags.txt index 213dcced..d693f790 100644 --- a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_270.doctags.txt +++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_270.doctags.txt @@ -1,2 +1,2 @@ -and last row 2and row 1this is row 0nothingsome cellsColumn 0otherhave contentColumn 1insidehaveandColumn 2 +Yet another valueSome other valuevalue \ No newline at end of file diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_270.json b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_270.json index 28b62daa..9bc6ea25 100644 --- a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_270.json +++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_270.json @@ -4,7 +4,7 @@ "name": "ocr_test_rotated_270", "origin": { "mimetype": "application/pdf", - "binary_hash": 142009988718862333, + "binary_hash": 8365439800722100027, "filename": "ocr_test_rotated_270.pdf" }, "furniture": { @@ -41,10 +41,10 @@ { "page_no": 1, "bbox": { - "l": 233.88, - "t": 739.02, - "r": 519.9, - "b": 280.96, + "l": 277.42, + "t": 722.96, + "r": 524.35, + "b": 240.9, "coord_origin": "BOTTOMLEFT" }, "charspan": [ @@ -60,67 +60,10 @@ "table_cells": [ { "bbox": { - "l": 474.71, - "t": 245.03, - "r": 488.43, - "b": 307.59, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "Column 0", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 474.71, - "t": 358.65, - "r": 488.43, - "b": 421.22, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "Column 1", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 474.71, - "t": 472.27, - "r": 488.43, - "b": 534.84, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "Column 2", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 407.21, - "t": 123.53, - "r": 420.93, - "b": 200.67, + "l": 443.33, + "t": 312.0, + "r": 490.33, + "b": 328.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -129,74 +72,17 @@ "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, - "text": "this is row 0", + "text": "value", "column_header": false, "row_header": false, "row_section": false }, { "bbox": { - "l": 407.21, - "t": 241.65, - "r": 420.93, - "b": 310.71, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "some cells", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 407.21, - "t": 347.4, - "r": 420.93, - "b": 431.1, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "have content", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 407.21, - "t": 491.4, - "r": 420.93, - "b": 515.79, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "and", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 338.59, - "t": 130.28, - "r": 352.3, - "b": 194.46, + "l": 262.33, + "t": 296.67, + "r": 365.0, + "b": 344.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -205,55 +91,17 @@ "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, - "text": "and row 1", + "text": "Some other value", "column_header": false, "row_header": false, "row_section": false }, { "bbox": { - "l": 338.59, - "t": 373.27, - "r": 352.3, - "b": 406.59, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "other", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 338.59, - "t": 486.9, - "r": 352.3, - "b": 518.61, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "have", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 265.46, - "t": 116.78, - "r": 279.18, - "b": 207.76, + "l": 98.0, + "t": 296.67, + "r": 203.67, + "b": 344.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -262,60 +110,22 @@ "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, - "text": "and last row 2", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 265.46, - "t": 251.78, - "r": 279.18, - "b": 299.73, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "nothing", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 265.46, - "t": 484.65, - "r": 279.18, - "b": 522.85, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "inside", + "text": "Yet another value", "column_header": false, "row_header": false, "row_section": false } ], - "num_rows": 4, - "num_cols": 4, + "num_rows": 1, + "num_cols": 3, "grid": [ [ { "bbox": { - "l": 265.46, - "t": 116.78, - "r": 279.18, - "b": 207.76, + "l": 98.0, + "t": 296.67, + "r": 203.67, + "b": 344.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -324,17 +134,17 @@ "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, - "text": "and last row 2", + "text": "Yet another value", "column_header": false, "row_header": false, "row_section": false }, { "bbox": { - "l": 338.59, - "t": 130.28, - "r": 352.3, - "b": 194.46, + "l": 262.33, + "t": 296.67, + "r": 365.0, + "b": 344.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -343,17 +153,17 @@ "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, - "text": "and row 1", + "text": "Some other value", "column_header": false, "row_header": false, "row_section": false }, { "bbox": { - "l": 407.21, - "t": 123.53, - "r": 420.93, - "b": 200.67, + "l": 443.33, + "t": 312.0, + "r": 490.33, + "b": 328.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -362,239 +172,7 @@ "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, - "text": "this is row 0", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "", - "column_header": false, - "row_header": false, - "row_section": false - } - ], - [ - { - "bbox": { - "l": 265.46, - "t": 251.78, - "r": 279.18, - "b": 299.73, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "nothing", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 407.21, - "t": 241.65, - "r": 420.93, - "b": 310.71, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "some cells", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 474.71, - "t": 245.03, - "r": 488.43, - "b": 307.59, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "Column 0", - "column_header": false, - "row_header": false, - "row_section": false - } - ], - [ - { - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 338.59, - "t": 373.27, - "r": 352.3, - "b": 406.59, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "other", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 407.21, - "t": 347.4, - "r": 420.93, - "b": 431.1, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "have content", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 474.71, - "t": 358.65, - "r": 488.43, - "b": 421.22, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "Column 1", - "column_header": false, - "row_header": false, - "row_section": false - } - ], - [ - { - "bbox": { - "l": 265.46, - "t": 484.65, - "r": 279.18, - "b": 522.85, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "inside", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 338.59, - "t": 486.9, - "r": 352.3, - "b": 518.61, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "have", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 407.21, - "t": 491.4, - "r": 420.93, - "b": 515.79, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "and", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 474.71, - "t": 472.27, - "r": 488.43, - "b": 534.84, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "Column 2", + "text": "value", "column_header": false, "row_header": false, "row_section": false @@ -610,8 +188,8 @@ "pages": { "1": { "size": { - "width": 595.0, - "height": 842.0 + "width": 612.0, + "height": 792.0 }, "page_no": 1 } diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_270.md b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_270.md index f423a6c2..e69de29b 100644 --- a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_270.md +++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_270.md @@ -1,5 +0,0 @@ -| and last row 2 | and row 1 | this is row 0 | | -|------------------|-------------|-----------------|----------| -| nothing | | some cells | Column 0 | -| | other | have content | Column 1 | -| inside | have | and | Column 2 | \ No newline at end of file diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_270.pages.json b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_270.pages.json index 339cb0a4..d77269ce 100644 --- a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_270.pages.json +++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_270.pages.json @@ -2,8 +2,8 @@ { "page_no": 0, "size": { - "width": 595.0, - "height": 842.0 + "width": 612.0, + "height": 792.0 }, "parsed_page": { "dimension": { @@ -11,47 +11,47 @@ "rect": { "r_x0": 0.0, "r_y0": 0.0, - "r_x1": 842.0, + "r_x1": 792.0, "r_y1": 0.0, - "r_x2": 842.0, - "r_y2": 595.0, + "r_x2": 792.0, + "r_y2": 612.0, "r_x3": 0.0, - "r_y3": 595.0, + "r_y3": 612.0, "coord_origin": "BOTTOMLEFT" }, "boundary_type": "crop_box", "art_bbox": { "l": 0.0, - "t": 595.0, - "r": 842.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" }, "bleed_bbox": { "l": 0.0, - "t": 595.0, - "r": 842.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" }, "crop_bbox": { "l": 0.0, - "t": 595.0, - "r": 842.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" }, "media_bbox": { "l": 0.0, - "t": 595.0, - "r": 842.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" }, "trim_bbox": { "l": 0.0, - "t": 595.0, - "r": 842.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" } @@ -69,21 +69,21 @@ "a": 255 }, "rect": { - "r_x0": 474.71, - "r_y0": 307.59, - "r_x1": 488.43, - "r_y1": 307.59, - "r_x2": 488.43, - "r_y2": 245.03, - "r_x3": 474.71, - "r_y3": 245.03, + "r_x0": 485.67, + "r_y0": 97.33, + "r_x1": 485.67, + "r_y1": 190.0, + "r_x2": 506.33, + "r_y2": 190.0, + "r_x3": 506.33, + "r_y3": 97.33, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 89.0, + "from_ocr": true }, { "index": 1, @@ -94,21 +94,21 @@ "a": 255 }, "rect": { - "r_x0": 474.71, - "r_y0": 421.22, - "r_x1": 488.43, - "r_y1": 421.22, - "r_x2": 488.43, - "r_y2": 358.65, - "r_x3": 474.71, - "r_y3": 358.65, + "r_x0": 454.33, + "r_y0": 112.0, + "r_x1": 454.33, + "r_y1": 182.33, + "r_x2": 475.0, + "r_y2": 182.33, + "r_x3": 475.0, + "r_y3": 112.0, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 2, @@ -119,21 +119,21 @@ "a": 255 }, "rect": { - "r_x0": 474.71, - "r_y0": 534.84, - "r_x1": 488.43, - "r_y1": 534.84, - "r_x2": 488.43, - "r_y2": 472.27, - "r_x3": 474.71, - "r_y3": 472.27, + "r_x0": 392.0, + "r_y0": 121.67, + "r_x1": 392.0, + "r_y1": 168.67, + "r_x2": 408.0, + "r_y2": 168.67, + "r_x3": 408.0, + "r_y3": 121.67, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 3, @@ -144,21 +144,21 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 200.67, - "r_x1": 420.93, - "r_y1": 200.67, - "r_x2": 420.93, - "r_y2": 123.53, - "r_x3": 407.21, - "r_y3": 123.53, + "r_x0": 312.0, + "r_y0": 121.67, + "r_x1": 312.0, + "r_y1": 168.67, + "r_x2": 328.0, + "r_y2": 168.67, + "r_x3": 328.0, + "r_y3": 121.67, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 4, @@ -169,21 +169,21 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 310.71, - "r_x1": 420.93, - "r_y1": 310.71, - "r_x2": 420.93, - "r_y2": 241.65, - "r_x3": 407.21, - "r_y3": 241.65, + "r_x0": 485.67, + "r_y0": 232.67, + "r_x1": 485.67, + "r_y1": 364.0, + "r_x2": 506.33, + "r_y2": 364.0, + "r_x3": 506.33, + "r_y3": 232.67, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 5, @@ -194,21 +194,21 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 431.1, - "r_x1": 420.93, - "r_y1": 431.1, - "r_x2": 420.93, - "r_y2": 347.4, - "r_x3": 407.21, - "r_y3": 347.4, + "r_x0": 459.0, + "r_y0": 265.67, + "r_x1": 459.0, + "r_y1": 336.0, + "r_x2": 475.0, + "r_y2": 336.0, + "r_x3": 475.0, + "r_y3": 265.67, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 6, @@ -219,21 +219,21 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 515.79, - "r_x1": 420.93, - "r_y1": 515.79, - "r_x2": 420.93, - "r_y2": 491.4, - "r_x3": 407.21, - "r_y3": 491.4, + "r_x0": 408.0, + "r_y0": 247.0, + "r_x1": 408.0, + "r_y1": 349.67, + "r_x2": 424.0, + "r_y2": 349.67, + "r_x3": 424.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 89.0, + "from_ocr": true }, { "index": 7, @@ -244,21 +244,21 @@ "a": 255 }, "rect": { - "r_x0": 338.59, - "r_y0": 194.46, - "r_x1": 352.3, - "r_y1": 194.46, - "r_x2": 352.3, - "r_y2": 130.28, - "r_x3": 338.59, - "r_y3": 130.28, + "r_x0": 376.0, + "r_y0": 277.0, + "r_x1": 376.0, + "r_y1": 324.33, + "r_x2": 392.0, + "r_y2": 324.33, + "r_x3": 392.0, + "r_y3": 277.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 8, @@ -269,21 +269,21 @@ "a": 255 }, "rect": { - "r_x0": 338.59, - "r_y0": 406.59, - "r_x1": 352.3, - "r_y1": 406.59, - "r_x2": 352.3, - "r_y2": 373.27, - "r_x3": 338.59, - "r_y3": 373.27, + "r_x0": 328.0, + "r_y0": 247.0, + "r_x1": 328.0, + "r_y1": 349.67, + "r_x2": 344.0, + "r_y2": 349.67, + "r_x3": 344.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 9, @@ -294,21 +294,21 @@ "a": 255 }, "rect": { - "r_x0": 338.59, - "r_y0": 518.61, - "r_x1": 352.3, - "r_y1": 518.61, - "r_x2": 352.3, - "r_y2": 486.9, - "r_x3": 338.59, - "r_y3": 486.9, + "r_x0": 296.67, + "r_y0": 277.33, + "r_x1": 296.67, + "r_y1": 324.33, + "r_x2": 312.67, + "r_y2": 324.33, + "r_x3": 312.67, + "r_y3": 277.33, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 10, @@ -319,21 +319,21 @@ "a": 255 }, "rect": { - "r_x0": 265.46, - "r_y0": 207.76, - "r_x1": 279.18, - "r_y1": 207.76, - "r_x2": 279.18, - "r_y2": 116.78, - "r_x3": 265.46, - "r_y3": 116.78, + "r_x0": 490.33, + "r_y0": 406.33, + "r_x1": 490.33, + "r_y1": 518.33, + "r_x2": 506.33, + "r_y2": 518.33, + "r_x3": 506.33, + "r_y3": 406.33, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 11, @@ -344,21 +344,21 @@ "a": 255 }, "rect": { - "r_x0": 265.46, - "r_y0": 299.73, - "r_x1": 279.18, - "r_y1": 299.73, - "r_x2": 279.18, - "r_y2": 251.78, - "r_x3": 265.46, - "r_y3": 251.78, + "r_x0": 459.0, + "r_y0": 429.33, + "r_x1": 459.0, + "r_y1": 499.33, + "r_x2": 475.0, + "r_y2": 499.33, + "r_x3": 475.0, + "r_y3": 429.33, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 12, @@ -369,21 +369,96 @@ "a": 255 }, "rect": { - "r_x0": 265.46, - "r_y0": 522.85, - "r_x1": 279.18, - "r_y1": 522.85, - "r_x2": 279.18, - "r_y2": 484.65, - "r_x3": 265.46, - "r_y3": 484.65, + "r_x0": 408.0, + "r_y0": 408.33, + "r_x1": 408.0, + "r_y1": 514.0, + "r_x2": 424.0, + "r_y2": 514.0, + "r_x3": 424.0, + "r_y3": 408.33, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 376.0, + "r_y0": 440.67, + "r_x1": 376.0, + "r_y1": 487.67, + "r_x2": 392.0, + "r_y2": 487.67, + "r_x3": 392.0, + "r_y3": 440.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + }, + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 328.0, + "r_y0": 408.33, + "r_x1": 328.0, + "r_y1": 514.0, + "r_x2": 344.0, + "r_y2": 514.0, + "r_x3": 344.0, + "r_y3": 408.33, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 296.67, + "r_y0": 440.67, + "r_x1": 296.67, + "r_y1": 487.67, + "r_x2": 312.67, + "r_y2": 487.67, + "r_x3": 312.67, + "r_y3": 440.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "has_chars": false, @@ -399,13 +474,13 @@ "id": 0, "label": "table", "bbox": { - "l": 233.88, - "t": 102.98, - "r": 519.9, - "b": 561.04, + "l": 277.42, + "t": 69.04, + "r": 524.35, + "b": 551.1, "coord_origin": "TOPLEFT" }, - "confidence": 0.967, + "confidence": 0.979, "cells": [ { "index": 0, @@ -416,21 +491,21 @@ "a": 255 }, "rect": { - "r_x0": 474.71, - "r_y0": 307.59, - "r_x1": 488.43, - "r_y1": 307.59, - "r_x2": 488.43, - "r_y2": 245.03, - "r_x3": 474.71, - "r_y3": 245.03, + "r_x0": 485.67, + "r_y0": 97.33, + "r_x1": 485.67, + "r_y1": 190.0, + "r_x2": 506.33, + "r_y2": 190.0, + "r_x3": 506.33, + "r_y3": 97.33, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 89.0, + "from_ocr": true }, { "index": 1, @@ -441,21 +516,21 @@ "a": 255 }, "rect": { - "r_x0": 474.71, - "r_y0": 421.22, - "r_x1": 488.43, - "r_y1": 421.22, - "r_x2": 488.43, - "r_y2": 358.65, - "r_x3": 474.71, - "r_y3": 358.65, + "r_x0": 454.33, + "r_y0": 112.0, + "r_x1": 454.33, + "r_y1": 182.33, + "r_x2": 475.0, + "r_y2": 182.33, + "r_x3": 475.0, + "r_y3": 112.0, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 2, @@ -466,21 +541,21 @@ "a": 255 }, "rect": { - "r_x0": 474.71, - "r_y0": 534.84, - "r_x1": 488.43, - "r_y1": 534.84, - "r_x2": 488.43, - "r_y2": 472.27, - "r_x3": 474.71, - "r_y3": 472.27, + "r_x0": 392.0, + "r_y0": 121.67, + "r_x1": 392.0, + "r_y1": 168.67, + "r_x2": 408.0, + "r_y2": 168.67, + "r_x3": 408.0, + "r_y3": 121.67, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 3, @@ -491,21 +566,21 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 200.67, - "r_x1": 420.93, - "r_y1": 200.67, - "r_x2": 420.93, - "r_y2": 123.53, - "r_x3": 407.21, - "r_y3": 123.53, + "r_x0": 312.0, + "r_y0": 121.67, + "r_x1": 312.0, + "r_y1": 168.67, + "r_x2": 328.0, + "r_y2": 168.67, + "r_x3": 328.0, + "r_y3": 121.67, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 4, @@ -516,21 +591,21 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 310.71, - "r_x1": 420.93, - "r_y1": 310.71, - "r_x2": 420.93, - "r_y2": 241.65, - "r_x3": 407.21, - "r_y3": 241.65, + "r_x0": 485.67, + "r_y0": 232.67, + "r_x1": 485.67, + "r_y1": 364.0, + "r_x2": 506.33, + "r_y2": 364.0, + "r_x3": 506.33, + "r_y3": 232.67, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 5, @@ -541,21 +616,21 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 431.1, - "r_x1": 420.93, - "r_y1": 431.1, - "r_x2": 420.93, - "r_y2": 347.4, - "r_x3": 407.21, - "r_y3": 347.4, + "r_x0": 459.0, + "r_y0": 265.67, + "r_x1": 459.0, + "r_y1": 336.0, + "r_x2": 475.0, + "r_y2": 336.0, + "r_x3": 475.0, + "r_y3": 265.67, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 6, @@ -566,21 +641,21 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 515.79, - "r_x1": 420.93, - "r_y1": 515.79, - "r_x2": 420.93, - "r_y2": 491.4, - "r_x3": 407.21, - "r_y3": 491.4, + "r_x0": 408.0, + "r_y0": 247.0, + "r_x1": 408.0, + "r_y1": 349.67, + "r_x2": 424.0, + "r_y2": 349.67, + "r_x3": 424.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 89.0, + "from_ocr": true }, { "index": 7, @@ -591,21 +666,21 @@ "a": 255 }, "rect": { - "r_x0": 338.59, - "r_y0": 194.46, - "r_x1": 352.3, - "r_y1": 194.46, - "r_x2": 352.3, - "r_y2": 130.28, - "r_x3": 338.59, - "r_y3": 130.28, + "r_x0": 376.0, + "r_y0": 277.0, + "r_x1": 376.0, + "r_y1": 324.33, + "r_x2": 392.0, + "r_y2": 324.33, + "r_x3": 392.0, + "r_y3": 277.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 8, @@ -616,21 +691,21 @@ "a": 255 }, "rect": { - "r_x0": 338.59, - "r_y0": 406.59, - "r_x1": 352.3, - "r_y1": 406.59, - "r_x2": 352.3, - "r_y2": 373.27, - "r_x3": 338.59, - "r_y3": 373.27, + "r_x0": 328.0, + "r_y0": 247.0, + "r_x1": 328.0, + "r_y1": 349.67, + "r_x2": 344.0, + "r_y2": 349.67, + "r_x3": 344.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 9, @@ -641,21 +716,21 @@ "a": 255 }, "rect": { - "r_x0": 338.59, - "r_y0": 518.61, - "r_x1": 352.3, - "r_y1": 518.61, - "r_x2": 352.3, - "r_y2": 486.9, - "r_x3": 338.59, - "r_y3": 486.9, + "r_x0": 296.67, + "r_y0": 277.33, + "r_x1": 296.67, + "r_y1": 324.33, + "r_x2": 312.67, + "r_y2": 324.33, + "r_x3": 312.67, + "r_y3": 277.33, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 10, @@ -666,21 +741,21 @@ "a": 255 }, "rect": { - "r_x0": 265.46, - "r_y0": 207.76, - "r_x1": 279.18, - "r_y1": 207.76, - "r_x2": 279.18, - "r_y2": 116.78, - "r_x3": 265.46, - "r_y3": 116.78, + "r_x0": 490.33, + "r_y0": 406.33, + "r_x1": 490.33, + "r_y1": 518.33, + "r_x2": 506.33, + "r_y2": 518.33, + "r_x3": 506.33, + "r_y3": 406.33, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 11, @@ -691,21 +766,21 @@ "a": 255 }, "rect": { - "r_x0": 265.46, - "r_y0": 299.73, - "r_x1": 279.18, - "r_y1": 299.73, - "r_x2": 279.18, - "r_y2": 251.78, - "r_x3": 265.46, - "r_y3": 251.78, + "r_x0": 459.0, + "r_y0": 429.33, + "r_x1": 459.0, + "r_y1": 499.33, + "r_x2": 475.0, + "r_y2": 499.33, + "r_x3": 475.0, + "r_y3": 429.33, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 12, @@ -716,35 +791,110 @@ "a": 255 }, "rect": { - "r_x0": 265.46, - "r_y0": 522.85, - "r_x1": 279.18, - "r_y1": 522.85, - "r_x2": 279.18, - "r_y2": 484.65, - "r_x3": 265.46, - "r_y3": 484.65, + "r_x0": 408.0, + "r_y0": 408.33, + "r_x1": 408.0, + "r_y1": 514.0, + "r_x2": 424.0, + "r_y2": 514.0, + "r_x3": 424.0, + "r_y3": 408.33, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 376.0, + "r_y0": 440.67, + "r_x1": 376.0, + "r_y1": 487.67, + "r_x2": 392.0, + "r_y2": 487.67, + "r_x3": 392.0, + "r_y3": 440.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + }, + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 328.0, + "r_y0": 408.33, + "r_x1": 328.0, + "r_y1": 514.0, + "r_x2": 344.0, + "r_y2": 514.0, + "r_x3": 344.0, + "r_y3": 408.33, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 296.67, + "r_y0": 440.67, + "r_x1": 296.67, + "r_y1": 487.67, + "r_x2": 312.67, + "r_y2": 487.67, + "r_x3": 312.67, + "r_y3": 440.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "children": [ { - "id": 4, + "id": 1, "label": "text", "bbox": { - "l": 474.71, - "t": 245.03, - "r": 488.43, - "b": 307.59, + "l": 485.67, + "t": 97.33, + "r": 506.33, + "b": 190.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 89.0, "cells": [ { "index": 0, @@ -755,36 +905,36 @@ "a": 255 }, "rect": { - "r_x0": 474.71, - "r_y0": 307.59, - "r_x1": 488.43, - "r_y1": 307.59, - "r_x2": 488.43, - "r_y2": 245.03, - "r_x3": 474.71, - "r_y3": 245.03, + "r_x0": 485.67, + "r_y0": 97.33, + "r_x1": 485.67, + "r_y1": 190.0, + "r_x2": 506.33, + "r_y2": 190.0, + "r_x3": 506.33, + "r_y3": 97.33, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 89.0, + "from_ocr": true } ], "children": [] }, { - "id": 5, + "id": 2, "label": "text", "bbox": { - "l": 474.71, - "t": 358.65, - "r": 488.43, - "b": 421.22, + "l": 454.33, + "t": 112.0, + "r": 475.0, + "b": 182.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 92.0, "cells": [ { "index": 1, @@ -795,36 +945,36 @@ "a": 255 }, "rect": { - "r_x0": 474.71, - "r_y0": 421.22, - "r_x1": 488.43, - "r_y1": 421.22, - "r_x2": 488.43, - "r_y2": 358.65, - "r_x3": 474.71, - "r_y3": 358.65, + "r_x0": 454.33, + "r_y0": 112.0, + "r_x1": 454.33, + "r_y1": 182.33, + "r_x2": 475.0, + "r_y2": 182.33, + "r_x3": 475.0, + "r_y3": 112.0, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true } ], "children": [] }, { - "id": 6, + "id": 3, "label": "text", "bbox": { - "l": 474.71, - "t": 472.27, - "r": 488.43, - "b": 534.84, + "l": 392.0, + "t": 121.67, + "r": 408.0, + "b": 168.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 2, @@ -835,36 +985,36 @@ "a": 255 }, "rect": { - "r_x0": 474.71, - "r_y0": 534.84, - "r_x1": 488.43, - "r_y1": 534.84, - "r_x2": 488.43, - "r_y2": 472.27, - "r_x3": 474.71, - "r_y3": 472.27, + "r_x0": 392.0, + "r_y0": 121.67, + "r_x1": 392.0, + "r_y1": 168.67, + "r_x2": 408.0, + "r_y2": 168.67, + "r_x3": 408.0, + "r_y3": 121.67, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true } ], "children": [] }, { - "id": 7, + "id": 4, "label": "text", "bbox": { - "l": 407.21, - "t": 123.53, - "r": 420.93, - "b": 200.67, + "l": 312.0, + "t": 121.67, + "r": 328.0, + "b": 168.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 3, @@ -875,36 +1025,36 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 200.67, - "r_x1": 420.93, - "r_y1": 200.67, - "r_x2": 420.93, - "r_y2": 123.53, - "r_x3": 407.21, - "r_y3": 123.53, + "r_x0": 312.0, + "r_y0": 121.67, + "r_x1": 312.0, + "r_y1": 168.67, + "r_x2": 328.0, + "r_y2": 168.67, + "r_x3": 328.0, + "r_y3": 121.67, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 8, + "id": 5, "label": "text", "bbox": { - "l": 407.21, - "t": 241.65, - "r": 420.93, - "b": 310.71, + "l": 485.67, + "t": 232.67, + "r": 506.33, + "b": 364.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 92.0, "cells": [ { "index": 4, @@ -915,36 +1065,36 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 310.71, - "r_x1": 420.93, - "r_y1": 310.71, - "r_x2": 420.93, - "r_y2": 241.65, - "r_x3": 407.21, - "r_y3": 241.65, + "r_x0": 485.67, + "r_y0": 232.67, + "r_x1": 485.67, + "r_y1": 364.0, + "r_x2": 506.33, + "r_y2": 364.0, + "r_x3": 506.33, + "r_y3": 232.67, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true } ], "children": [] }, { - "id": 9, + "id": 6, "label": "text", "bbox": { - "l": 407.21, - "t": 347.4, - "r": 420.93, - "b": 431.1, + "l": 459.0, + "t": 265.67, + "r": 475.0, + "b": 336.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 5, @@ -955,36 +1105,36 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 431.1, - "r_x1": 420.93, - "r_y1": 431.1, - "r_x2": 420.93, - "r_y2": 347.4, - "r_x3": 407.21, - "r_y3": 347.4, + "r_x0": 459.0, + "r_y0": 265.67, + "r_x1": 459.0, + "r_y1": 336.0, + "r_x2": 475.0, + "r_y2": 336.0, + "r_x3": 475.0, + "r_y3": 265.67, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 10, + "id": 7, "label": "text", "bbox": { - "l": 407.21, - "t": 491.4, - "r": 420.93, - "b": 515.79, + "l": 408.0, + "t": 247.0, + "r": 424.0, + "b": 349.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 89.0, "cells": [ { "index": 6, @@ -995,36 +1145,36 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 515.79, - "r_x1": 420.93, - "r_y1": 515.79, - "r_x2": 420.93, - "r_y2": 491.4, - "r_x3": 407.21, - "r_y3": 491.4, + "r_x0": 408.0, + "r_y0": 247.0, + "r_x1": 408.0, + "r_y1": 349.67, + "r_x2": 424.0, + "r_y2": 349.67, + "r_x3": 424.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 89.0, + "from_ocr": true } ], "children": [] }, { - "id": 11, + "id": 8, "label": "text", "bbox": { - "l": 338.59, - "t": 130.28, - "r": 352.3, - "b": 194.46, + "l": 376.0, + "t": 277.0, + "r": 392.0, + "b": 324.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 7, @@ -1035,36 +1185,36 @@ "a": 255 }, "rect": { - "r_x0": 338.59, - "r_y0": 194.46, - "r_x1": 352.3, - "r_y1": 194.46, - "r_x2": 352.3, - "r_y2": 130.28, - "r_x3": 338.59, - "r_y3": 130.28, + "r_x0": 376.0, + "r_y0": 277.0, + "r_x1": 376.0, + "r_y1": 324.33, + "r_x2": 392.0, + "r_y2": 324.33, + "r_x3": 392.0, + "r_y3": 277.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 12, + "id": 9, "label": "text", "bbox": { - "l": 338.59, - "t": 373.27, - "r": 352.3, - "b": 406.59, + "l": 328.0, + "t": 247.0, + "r": 344.0, + "b": 349.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 8, @@ -1075,36 +1225,36 @@ "a": 255 }, "rect": { - "r_x0": 338.59, - "r_y0": 406.59, - "r_x1": 352.3, - "r_y1": 406.59, - "r_x2": 352.3, - "r_y2": 373.27, - "r_x3": 338.59, - "r_y3": 373.27, + "r_x0": 328.0, + "r_y0": 247.0, + "r_x1": 328.0, + "r_y1": 349.67, + "r_x2": 344.0, + "r_y2": 349.67, + "r_x3": 344.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true } ], "children": [] }, { - "id": 13, + "id": 10, "label": "text", "bbox": { - "l": 338.59, - "t": 486.9, - "r": 352.3, - "b": 518.61, + "l": 296.67, + "t": 277.33, + "r": 312.67, + "b": 324.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 9, @@ -1115,36 +1265,36 @@ "a": 255 }, "rect": { - "r_x0": 338.59, - "r_y0": 518.61, - "r_x1": 352.3, - "r_y1": 518.61, - "r_x2": 352.3, - "r_y2": 486.9, - "r_x3": 338.59, - "r_y3": 486.9, + "r_x0": 296.67, + "r_y0": 277.33, + "r_x1": 296.67, + "r_y1": 324.33, + "r_x2": 312.67, + "r_y2": 324.33, + "r_x3": 312.67, + "r_y3": 277.33, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 14, + "id": 11, "label": "text", "bbox": { - "l": 265.46, - "t": 116.78, - "r": 279.18, - "b": 207.76, + "l": 490.33, + "t": 406.33, + "r": 506.33, + "b": 518.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 10, @@ -1155,36 +1305,36 @@ "a": 255 }, "rect": { - "r_x0": 265.46, - "r_y0": 207.76, - "r_x1": 279.18, - "r_y1": 207.76, - "r_x2": 279.18, - "r_y2": 116.78, - "r_x3": 265.46, - "r_y3": 116.78, + "r_x0": 490.33, + "r_y0": 406.33, + "r_x1": 490.33, + "r_y1": 518.33, + "r_x2": 506.33, + "r_y2": 518.33, + "r_x3": 506.33, + "r_y3": 406.33, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true } ], "children": [] }, { - "id": 15, + "id": 12, "label": "text", "bbox": { - "l": 265.46, - "t": 251.78, - "r": 279.18, - "b": 299.73, + "l": 459.0, + "t": 429.33, + "r": 475.0, + "b": 499.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 11, @@ -1195,36 +1345,36 @@ "a": 255 }, "rect": { - "r_x0": 265.46, - "r_y0": 299.73, - "r_x1": 279.18, - "r_y1": 299.73, - "r_x2": 279.18, - "r_y2": 251.78, - "r_x3": 265.46, - "r_y3": 251.78, + "r_x0": 459.0, + "r_y0": 429.33, + "r_x1": 459.0, + "r_y1": 499.33, + "r_x2": 475.0, + "r_y2": 499.33, + "r_x3": 475.0, + "r_y3": 429.33, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 16, + "id": 13, "label": "text", "bbox": { - "l": 265.46, - "t": 484.65, - "r": 279.18, - "b": 522.85, + "l": 408.0, + "t": 408.33, + "r": 424.0, + "b": 514.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 12, @@ -1235,21 +1385,141 @@ "a": 255 }, "rect": { - "r_x0": 265.46, - "r_y0": 522.85, - "r_x1": 279.18, - "r_y1": 522.85, - "r_x2": 279.18, - "r_y2": 484.65, - "r_x3": 265.46, - "r_y3": 484.65, + "r_x0": 408.0, + "r_y0": 408.33, + "r_x1": 408.0, + "r_y1": 514.0, + "r_x2": 424.0, + "r_y2": 514.0, + "r_x3": 424.0, + "r_y3": 408.33, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 14, + "label": "text", + "bbox": { + "l": 376.0, + "t": 440.67, + "r": 392.0, + "b": 487.67, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 376.0, + "r_y0": 440.67, + "r_x1": 376.0, + "r_y1": 487.67, + "r_x2": 392.0, + "r_y2": 487.67, + "r_x3": 392.0, + "r_y3": 440.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 15, + "label": "text", + "bbox": { + "l": 328.0, + "t": 408.33, + "r": 344.0, + "b": 514.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 328.0, + "r_y0": 408.33, + "r_x1": 328.0, + "r_y1": 514.0, + "r_x2": 344.0, + "r_y2": 514.0, + "r_x3": 344.0, + "r_y3": 408.33, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 16, + "label": "text", + "bbox": { + "l": 296.67, + "t": 440.67, + "r": 312.67, + "b": 487.67, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 296.67, + "r_y0": 440.67, + "r_x1": 296.67, + "r_y1": 487.67, + "r_x2": 312.67, + "r_y2": 487.67, + "r_x3": 312.67, + "r_y3": 440.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "children": [] @@ -1268,13 +1538,13 @@ "id": 0, "label": "table", "bbox": { - "l": 233.88, - "t": 102.98, - "r": 519.9, - "b": 561.04, + "l": 277.42, + "t": 69.04, + "r": 524.35, + "b": 551.1, "coord_origin": "TOPLEFT" }, - "confidence": 0.967, + "confidence": 0.979, "cells": [ { "index": 0, @@ -1285,21 +1555,21 @@ "a": 255 }, "rect": { - "r_x0": 474.71, - "r_y0": 307.59, - "r_x1": 488.43, - "r_y1": 307.59, - "r_x2": 488.43, - "r_y2": 245.03, - "r_x3": 474.71, - "r_y3": 245.03, + "r_x0": 485.67, + "r_y0": 97.33, + "r_x1": 485.67, + "r_y1": 190.0, + "r_x2": 506.33, + "r_y2": 190.0, + "r_x3": 506.33, + "r_y3": 97.33, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 89.0, + "from_ocr": true }, { "index": 1, @@ -1310,21 +1580,21 @@ "a": 255 }, "rect": { - "r_x0": 474.71, - "r_y0": 421.22, - "r_x1": 488.43, - "r_y1": 421.22, - "r_x2": 488.43, - "r_y2": 358.65, - "r_x3": 474.71, - "r_y3": 358.65, + "r_x0": 454.33, + "r_y0": 112.0, + "r_x1": 454.33, + "r_y1": 182.33, + "r_x2": 475.0, + "r_y2": 182.33, + "r_x3": 475.0, + "r_y3": 112.0, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 2, @@ -1335,21 +1605,21 @@ "a": 255 }, "rect": { - "r_x0": 474.71, - "r_y0": 534.84, - "r_x1": 488.43, - "r_y1": 534.84, - "r_x2": 488.43, - "r_y2": 472.27, - "r_x3": 474.71, - "r_y3": 472.27, + "r_x0": 392.0, + "r_y0": 121.67, + "r_x1": 392.0, + "r_y1": 168.67, + "r_x2": 408.0, + "r_y2": 168.67, + "r_x3": 408.0, + "r_y3": 121.67, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 3, @@ -1360,21 +1630,21 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 200.67, - "r_x1": 420.93, - "r_y1": 200.67, - "r_x2": 420.93, - "r_y2": 123.53, - "r_x3": 407.21, - "r_y3": 123.53, + "r_x0": 312.0, + "r_y0": 121.67, + "r_x1": 312.0, + "r_y1": 168.67, + "r_x2": 328.0, + "r_y2": 168.67, + "r_x3": 328.0, + "r_y3": 121.67, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 4, @@ -1385,21 +1655,21 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 310.71, - "r_x1": 420.93, - "r_y1": 310.71, - "r_x2": 420.93, - "r_y2": 241.65, - "r_x3": 407.21, - "r_y3": 241.65, + "r_x0": 485.67, + "r_y0": 232.67, + "r_x1": 485.67, + "r_y1": 364.0, + "r_x2": 506.33, + "r_y2": 364.0, + "r_x3": 506.33, + "r_y3": 232.67, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 5, @@ -1410,21 +1680,21 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 431.1, - "r_x1": 420.93, - "r_y1": 431.1, - "r_x2": 420.93, - "r_y2": 347.4, - "r_x3": 407.21, - "r_y3": 347.4, + "r_x0": 459.0, + "r_y0": 265.67, + "r_x1": 459.0, + "r_y1": 336.0, + "r_x2": 475.0, + "r_y2": 336.0, + "r_x3": 475.0, + "r_y3": 265.67, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 6, @@ -1435,21 +1705,21 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 515.79, - "r_x1": 420.93, - "r_y1": 515.79, - "r_x2": 420.93, - "r_y2": 491.4, - "r_x3": 407.21, - "r_y3": 491.4, + "r_x0": 408.0, + "r_y0": 247.0, + "r_x1": 408.0, + "r_y1": 349.67, + "r_x2": 424.0, + "r_y2": 349.67, + "r_x3": 424.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 89.0, + "from_ocr": true }, { "index": 7, @@ -1460,21 +1730,21 @@ "a": 255 }, "rect": { - "r_x0": 338.59, - "r_y0": 194.46, - "r_x1": 352.3, - "r_y1": 194.46, - "r_x2": 352.3, - "r_y2": 130.28, - "r_x3": 338.59, - "r_y3": 130.28, + "r_x0": 376.0, + "r_y0": 277.0, + "r_x1": 376.0, + "r_y1": 324.33, + "r_x2": 392.0, + "r_y2": 324.33, + "r_x3": 392.0, + "r_y3": 277.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 8, @@ -1485,21 +1755,21 @@ "a": 255 }, "rect": { - "r_x0": 338.59, - "r_y0": 406.59, - "r_x1": 352.3, - "r_y1": 406.59, - "r_x2": 352.3, - "r_y2": 373.27, - "r_x3": 338.59, - "r_y3": 373.27, + "r_x0": 328.0, + "r_y0": 247.0, + "r_x1": 328.0, + "r_y1": 349.67, + "r_x2": 344.0, + "r_y2": 349.67, + "r_x3": 344.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 9, @@ -1510,21 +1780,21 @@ "a": 255 }, "rect": { - "r_x0": 338.59, - "r_y0": 518.61, - "r_x1": 352.3, - "r_y1": 518.61, - "r_x2": 352.3, - "r_y2": 486.9, - "r_x3": 338.59, - "r_y3": 486.9, + "r_x0": 296.67, + "r_y0": 277.33, + "r_x1": 296.67, + "r_y1": 324.33, + "r_x2": 312.67, + "r_y2": 324.33, + "r_x3": 312.67, + "r_y3": 277.33, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 10, @@ -1535,21 +1805,21 @@ "a": 255 }, "rect": { - "r_x0": 265.46, - "r_y0": 207.76, - "r_x1": 279.18, - "r_y1": 207.76, - "r_x2": 279.18, - "r_y2": 116.78, - "r_x3": 265.46, - "r_y3": 116.78, + "r_x0": 490.33, + "r_y0": 406.33, + "r_x1": 490.33, + "r_y1": 518.33, + "r_x2": 506.33, + "r_y2": 518.33, + "r_x3": 506.33, + "r_y3": 406.33, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 11, @@ -1560,21 +1830,21 @@ "a": 255 }, "rect": { - "r_x0": 265.46, - "r_y0": 299.73, - "r_x1": 279.18, - "r_y1": 299.73, - "r_x2": 279.18, - "r_y2": 251.78, - "r_x3": 265.46, - "r_y3": 251.78, + "r_x0": 459.0, + "r_y0": 429.33, + "r_x1": 459.0, + "r_y1": 499.33, + "r_x2": 475.0, + "r_y2": 499.33, + "r_x3": 475.0, + "r_y3": 429.33, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 12, @@ -1585,35 +1855,110 @@ "a": 255 }, "rect": { - "r_x0": 265.46, - "r_y0": 522.85, - "r_x1": 279.18, - "r_y1": 522.85, - "r_x2": 279.18, - "r_y2": 484.65, - "r_x3": 265.46, - "r_y3": 484.65, + "r_x0": 408.0, + "r_y0": 408.33, + "r_x1": 408.0, + "r_y1": 514.0, + "r_x2": 424.0, + "r_y2": 514.0, + "r_x3": 424.0, + "r_y3": 408.33, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 376.0, + "r_y0": 440.67, + "r_x1": 376.0, + "r_y1": 487.67, + "r_x2": 392.0, + "r_y2": 487.67, + "r_x3": 392.0, + "r_y3": 440.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + }, + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 328.0, + "r_y0": 408.33, + "r_x1": 328.0, + "r_y1": 514.0, + "r_x2": 344.0, + "r_y2": 514.0, + "r_x3": 344.0, + "r_y3": 408.33, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 296.67, + "r_y0": 440.67, + "r_x1": 296.67, + "r_y1": 487.67, + "r_x2": 312.67, + "r_y2": 487.67, + "r_x3": 312.67, + "r_y3": 440.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "children": [ { - "id": 4, + "id": 1, "label": "text", "bbox": { - "l": 474.71, - "t": 245.03, - "r": 488.43, - "b": 307.59, + "l": 485.67, + "t": 97.33, + "r": 506.33, + "b": 190.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 89.0, "cells": [ { "index": 0, @@ -1624,36 +1969,36 @@ "a": 255 }, "rect": { - "r_x0": 474.71, - "r_y0": 307.59, - "r_x1": 488.43, - "r_y1": 307.59, - "r_x2": 488.43, - "r_y2": 245.03, - "r_x3": 474.71, - "r_y3": 245.03, + "r_x0": 485.67, + "r_y0": 97.33, + "r_x1": 485.67, + "r_y1": 190.0, + "r_x2": 506.33, + "r_y2": 190.0, + "r_x3": 506.33, + "r_y3": 97.33, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 89.0, + "from_ocr": true } ], "children": [] }, { - "id": 5, + "id": 2, "label": "text", "bbox": { - "l": 474.71, - "t": 358.65, - "r": 488.43, - "b": 421.22, + "l": 454.33, + "t": 112.0, + "r": 475.0, + "b": 182.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 92.0, "cells": [ { "index": 1, @@ -1664,36 +2009,36 @@ "a": 255 }, "rect": { - "r_x0": 474.71, - "r_y0": 421.22, - "r_x1": 488.43, - "r_y1": 421.22, - "r_x2": 488.43, - "r_y2": 358.65, - "r_x3": 474.71, - "r_y3": 358.65, + "r_x0": 454.33, + "r_y0": 112.0, + "r_x1": 454.33, + "r_y1": 182.33, + "r_x2": 475.0, + "r_y2": 182.33, + "r_x3": 475.0, + "r_y3": 112.0, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true } ], "children": [] }, { - "id": 6, + "id": 3, "label": "text", "bbox": { - "l": 474.71, - "t": 472.27, - "r": 488.43, - "b": 534.84, + "l": 392.0, + "t": 121.67, + "r": 408.0, + "b": 168.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 2, @@ -1704,36 +2049,36 @@ "a": 255 }, "rect": { - "r_x0": 474.71, - "r_y0": 534.84, - "r_x1": 488.43, - "r_y1": 534.84, - "r_x2": 488.43, - "r_y2": 472.27, - "r_x3": 474.71, - "r_y3": 472.27, + "r_x0": 392.0, + "r_y0": 121.67, + "r_x1": 392.0, + "r_y1": 168.67, + "r_x2": 408.0, + "r_y2": 168.67, + "r_x3": 408.0, + "r_y3": 121.67, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true } ], "children": [] }, { - "id": 7, + "id": 4, "label": "text", "bbox": { - "l": 407.21, - "t": 123.53, - "r": 420.93, - "b": 200.67, + "l": 312.0, + "t": 121.67, + "r": 328.0, + "b": 168.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 3, @@ -1744,36 +2089,36 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 200.67, - "r_x1": 420.93, - "r_y1": 200.67, - "r_x2": 420.93, - "r_y2": 123.53, - "r_x3": 407.21, - "r_y3": 123.53, + "r_x0": 312.0, + "r_y0": 121.67, + "r_x1": 312.0, + "r_y1": 168.67, + "r_x2": 328.0, + "r_y2": 168.67, + "r_x3": 328.0, + "r_y3": 121.67, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 8, + "id": 5, "label": "text", "bbox": { - "l": 407.21, - "t": 241.65, - "r": 420.93, - "b": 310.71, + "l": 485.67, + "t": 232.67, + "r": 506.33, + "b": 364.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 92.0, "cells": [ { "index": 4, @@ -1784,36 +2129,36 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 310.71, - "r_x1": 420.93, - "r_y1": 310.71, - "r_x2": 420.93, - "r_y2": 241.65, - "r_x3": 407.21, - "r_y3": 241.65, + "r_x0": 485.67, + "r_y0": 232.67, + "r_x1": 485.67, + "r_y1": 364.0, + "r_x2": 506.33, + "r_y2": 364.0, + "r_x3": 506.33, + "r_y3": 232.67, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true } ], "children": [] }, { - "id": 9, + "id": 6, "label": "text", "bbox": { - "l": 407.21, - "t": 347.4, - "r": 420.93, - "b": 431.1, + "l": 459.0, + "t": 265.67, + "r": 475.0, + "b": 336.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 5, @@ -1824,36 +2169,36 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 431.1, - "r_x1": 420.93, - "r_y1": 431.1, - "r_x2": 420.93, - "r_y2": 347.4, - "r_x3": 407.21, - "r_y3": 347.4, + "r_x0": 459.0, + "r_y0": 265.67, + "r_x1": 459.0, + "r_y1": 336.0, + "r_x2": 475.0, + "r_y2": 336.0, + "r_x3": 475.0, + "r_y3": 265.67, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 10, + "id": 7, "label": "text", "bbox": { - "l": 407.21, - "t": 491.4, - "r": 420.93, - "b": 515.79, + "l": 408.0, + "t": 247.0, + "r": 424.0, + "b": 349.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 89.0, "cells": [ { "index": 6, @@ -1864,36 +2209,36 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 515.79, - "r_x1": 420.93, - "r_y1": 515.79, - "r_x2": 420.93, - "r_y2": 491.4, - "r_x3": 407.21, - "r_y3": 491.4, + "r_x0": 408.0, + "r_y0": 247.0, + "r_x1": 408.0, + "r_y1": 349.67, + "r_x2": 424.0, + "r_y2": 349.67, + "r_x3": 424.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 89.0, + "from_ocr": true } ], "children": [] }, { - "id": 11, + "id": 8, "label": "text", "bbox": { - "l": 338.59, - "t": 130.28, - "r": 352.3, - "b": 194.46, + "l": 376.0, + "t": 277.0, + "r": 392.0, + "b": 324.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 7, @@ -1904,36 +2249,36 @@ "a": 255 }, "rect": { - "r_x0": 338.59, - "r_y0": 194.46, - "r_x1": 352.3, - "r_y1": 194.46, - "r_x2": 352.3, - "r_y2": 130.28, - "r_x3": 338.59, - "r_y3": 130.28, + "r_x0": 376.0, + "r_y0": 277.0, + "r_x1": 376.0, + "r_y1": 324.33, + "r_x2": 392.0, + "r_y2": 324.33, + "r_x3": 392.0, + "r_y3": 277.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 12, + "id": 9, "label": "text", "bbox": { - "l": 338.59, - "t": 373.27, - "r": 352.3, - "b": 406.59, + "l": 328.0, + "t": 247.0, + "r": 344.0, + "b": 349.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 8, @@ -1944,36 +2289,36 @@ "a": 255 }, "rect": { - "r_x0": 338.59, - "r_y0": 406.59, - "r_x1": 352.3, - "r_y1": 406.59, - "r_x2": 352.3, - "r_y2": 373.27, - "r_x3": 338.59, - "r_y3": 373.27, + "r_x0": 328.0, + "r_y0": 247.0, + "r_x1": 328.0, + "r_y1": 349.67, + "r_x2": 344.0, + "r_y2": 349.67, + "r_x3": 344.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true } ], "children": [] }, { - "id": 13, + "id": 10, "label": "text", "bbox": { - "l": 338.59, - "t": 486.9, - "r": 352.3, - "b": 518.61, + "l": 296.67, + "t": 277.33, + "r": 312.67, + "b": 324.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 9, @@ -1984,36 +2329,36 @@ "a": 255 }, "rect": { - "r_x0": 338.59, - "r_y0": 518.61, - "r_x1": 352.3, - "r_y1": 518.61, - "r_x2": 352.3, - "r_y2": 486.9, - "r_x3": 338.59, - "r_y3": 486.9, + "r_x0": 296.67, + "r_y0": 277.33, + "r_x1": 296.67, + "r_y1": 324.33, + "r_x2": 312.67, + "r_y2": 324.33, + "r_x3": 312.67, + "r_y3": 277.33, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 14, + "id": 11, "label": "text", "bbox": { - "l": 265.46, - "t": 116.78, - "r": 279.18, - "b": 207.76, + "l": 490.33, + "t": 406.33, + "r": 506.33, + "b": 518.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 10, @@ -2024,36 +2369,36 @@ "a": 255 }, "rect": { - "r_x0": 265.46, - "r_y0": 207.76, - "r_x1": 279.18, - "r_y1": 207.76, - "r_x2": 279.18, - "r_y2": 116.78, - "r_x3": 265.46, - "r_y3": 116.78, + "r_x0": 490.33, + "r_y0": 406.33, + "r_x1": 490.33, + "r_y1": 518.33, + "r_x2": 506.33, + "r_y2": 518.33, + "r_x3": 506.33, + "r_y3": 406.33, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true } ], "children": [] }, { - "id": 15, + "id": 12, "label": "text", "bbox": { - "l": 265.46, - "t": 251.78, - "r": 279.18, - "b": 299.73, + "l": 459.0, + "t": 429.33, + "r": 475.0, + "b": 499.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 11, @@ -2064,36 +2409,36 @@ "a": 255 }, "rect": { - "r_x0": 265.46, - "r_y0": 299.73, - "r_x1": 279.18, - "r_y1": 299.73, - "r_x2": 279.18, - "r_y2": 251.78, - "r_x3": 265.46, - "r_y3": 251.78, + "r_x0": 459.0, + "r_y0": 429.33, + "r_x1": 459.0, + "r_y1": 499.33, + "r_x2": 475.0, + "r_y2": 499.33, + "r_x3": 475.0, + "r_y3": 429.33, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 16, + "id": 13, "label": "text", "bbox": { - "l": 265.46, - "t": 484.65, - "r": 279.18, - "b": 522.85, + "l": 408.0, + "t": 408.33, + "r": 424.0, + "b": 514.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 12, @@ -2104,21 +2449,141 @@ "a": 255 }, "rect": { - "r_x0": 265.46, - "r_y0": 522.85, - "r_x1": 279.18, - "r_y1": 522.85, - "r_x2": 279.18, - "r_y2": 484.65, - "r_x3": 265.46, - "r_y3": 484.65, + "r_x0": 408.0, + "r_y0": 408.33, + "r_x1": 408.0, + "r_y1": 514.0, + "r_x2": 424.0, + "r_y2": 514.0, + "r_x3": 424.0, + "r_y3": 408.33, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 14, + "label": "text", + "bbox": { + "l": 376.0, + "t": 440.67, + "r": 392.0, + "b": 487.67, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 376.0, + "r_y0": 440.67, + "r_x1": 376.0, + "r_y1": 487.67, + "r_x2": 392.0, + "r_y2": 487.67, + "r_x3": 392.0, + "r_y3": 440.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 15, + "label": "text", + "bbox": { + "l": 328.0, + "t": 408.33, + "r": 344.0, + "b": 514.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 328.0, + "r_y0": 408.33, + "r_x1": 328.0, + "r_y1": 514.0, + "r_x2": 344.0, + "r_y2": 514.0, + "r_x3": 344.0, + "r_y3": 408.33, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 16, + "label": "text", + "bbox": { + "l": 296.67, + "t": 440.67, + "r": 312.67, + "b": 487.67, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 296.67, + "r_y0": 440.67, + "r_x1": 296.67, + "r_y1": 487.67, + "r_x2": 312.67, + "r_y2": 487.67, + "r_x3": 312.67, + "r_y3": 440.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "children": [] @@ -2127,93 +2592,28 @@ }, "text": null, "otsl_seq": [ - "fcel", - "fcel", - "fcel", - "ecel", + "ched", + "ched", + "ched", "nl", "fcel", - "ecel", - "fcel", - "fcel", - "nl", - "ecel", - "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", - "fcel", "nl" ], - "num_rows": 4, - "num_cols": 4, + "num_rows": 1, + "num_cols": 3, "table_cells": [ { "bbox": { - "l": 474.71, - "t": 245.03, - "r": 488.43, - "b": 307.59, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "Column 0", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 474.71, - "t": 358.65, - "r": 488.43, - "b": 421.22, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "Column 1", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 474.71, - "t": 472.27, - "r": 488.43, - "b": 534.84, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "Column 2", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 407.21, - "t": 123.53, - "r": 420.93, - "b": 200.67, + "l": 443.33, + "t": 312.0, + "r": 490.33, + "b": 328.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -2222,74 +2622,17 @@ "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, - "text": "this is row 0", + "text": "value", "column_header": false, "row_header": false, "row_section": false }, { "bbox": { - "l": 407.21, - "t": 241.65, - "r": 420.93, - "b": 310.71, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "some cells", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 407.21, - "t": 347.4, - "r": 420.93, - "b": 431.1, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "have content", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 407.21, - "t": 491.4, - "r": 420.93, - "b": 515.79, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "and", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 338.59, - "t": 130.28, - "r": 352.3, - "b": 194.46, + "l": 262.33, + "t": 296.67, + "r": 365.0, + "b": 344.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -2298,55 +2641,17 @@ "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, - "text": "and row 1", + "text": "Some other value", "column_header": false, "row_header": false, "row_section": false }, { "bbox": { - "l": 338.59, - "t": 373.27, - "r": 352.3, - "b": 406.59, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "other", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 338.59, - "t": 486.9, - "r": 352.3, - "b": 518.61, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "have", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 265.46, - "t": 116.78, - "r": 279.18, - "b": 207.76, + "l": 98.0, + "t": 296.67, + "r": 203.67, + "b": 344.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -2355,45 +2660,7 @@ "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, - "text": "and last row 2", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 265.46, - "t": 251.78, - "r": 279.18, - "b": 299.73, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "nothing", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 265.46, - "t": 484.65, - "r": 279.18, - "b": 522.85, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "inside", + "text": "Yet another value", "column_header": false, "row_header": false, "row_section": false @@ -2416,13 +2683,13 @@ "id": 0, "label": "table", "bbox": { - "l": 233.88, - "t": 102.98, - "r": 519.9, - "b": 561.04, + "l": 277.42, + "t": 69.04, + "r": 524.35, + "b": 551.1, "coord_origin": "TOPLEFT" }, - "confidence": 0.967, + "confidence": 0.979, "cells": [ { "index": 0, @@ -2433,21 +2700,21 @@ "a": 255 }, "rect": { - "r_x0": 474.71, - "r_y0": 307.59, - "r_x1": 488.43, - "r_y1": 307.59, - "r_x2": 488.43, - "r_y2": 245.03, - "r_x3": 474.71, - "r_y3": 245.03, + "r_x0": 485.67, + "r_y0": 97.33, + "r_x1": 485.67, + "r_y1": 190.0, + "r_x2": 506.33, + "r_y2": 190.0, + "r_x3": 506.33, + "r_y3": 97.33, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 89.0, + "from_ocr": true }, { "index": 1, @@ -2458,21 +2725,21 @@ "a": 255 }, "rect": { - "r_x0": 474.71, - "r_y0": 421.22, - "r_x1": 488.43, - "r_y1": 421.22, - "r_x2": 488.43, - "r_y2": 358.65, - "r_x3": 474.71, - "r_y3": 358.65, + "r_x0": 454.33, + "r_y0": 112.0, + "r_x1": 454.33, + "r_y1": 182.33, + "r_x2": 475.0, + "r_y2": 182.33, + "r_x3": 475.0, + "r_y3": 112.0, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 2, @@ -2483,21 +2750,21 @@ "a": 255 }, "rect": { - "r_x0": 474.71, - "r_y0": 534.84, - "r_x1": 488.43, - "r_y1": 534.84, - "r_x2": 488.43, - "r_y2": 472.27, - "r_x3": 474.71, - "r_y3": 472.27, + "r_x0": 392.0, + "r_y0": 121.67, + "r_x1": 392.0, + "r_y1": 168.67, + "r_x2": 408.0, + "r_y2": 168.67, + "r_x3": 408.0, + "r_y3": 121.67, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 3, @@ -2508,21 +2775,21 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 200.67, - "r_x1": 420.93, - "r_y1": 200.67, - "r_x2": 420.93, - "r_y2": 123.53, - "r_x3": 407.21, - "r_y3": 123.53, + "r_x0": 312.0, + "r_y0": 121.67, + "r_x1": 312.0, + "r_y1": 168.67, + "r_x2": 328.0, + "r_y2": 168.67, + "r_x3": 328.0, + "r_y3": 121.67, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 4, @@ -2533,21 +2800,21 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 310.71, - "r_x1": 420.93, - "r_y1": 310.71, - "r_x2": 420.93, - "r_y2": 241.65, - "r_x3": 407.21, - "r_y3": 241.65, + "r_x0": 485.67, + "r_y0": 232.67, + "r_x1": 485.67, + "r_y1": 364.0, + "r_x2": 506.33, + "r_y2": 364.0, + "r_x3": 506.33, + "r_y3": 232.67, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 5, @@ -2558,21 +2825,21 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 431.1, - "r_x1": 420.93, - "r_y1": 431.1, - "r_x2": 420.93, - "r_y2": 347.4, - "r_x3": 407.21, - "r_y3": 347.4, + "r_x0": 459.0, + "r_y0": 265.67, + "r_x1": 459.0, + "r_y1": 336.0, + "r_x2": 475.0, + "r_y2": 336.0, + "r_x3": 475.0, + "r_y3": 265.67, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 6, @@ -2583,21 +2850,21 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 515.79, - "r_x1": 420.93, - "r_y1": 515.79, - "r_x2": 420.93, - "r_y2": 491.4, - "r_x3": 407.21, - "r_y3": 491.4, + "r_x0": 408.0, + "r_y0": 247.0, + "r_x1": 408.0, + "r_y1": 349.67, + "r_x2": 424.0, + "r_y2": 349.67, + "r_x3": 424.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 89.0, + "from_ocr": true }, { "index": 7, @@ -2608,21 +2875,21 @@ "a": 255 }, "rect": { - "r_x0": 338.59, - "r_y0": 194.46, - "r_x1": 352.3, - "r_y1": 194.46, - "r_x2": 352.3, - "r_y2": 130.28, - "r_x3": 338.59, - "r_y3": 130.28, + "r_x0": 376.0, + "r_y0": 277.0, + "r_x1": 376.0, + "r_y1": 324.33, + "r_x2": 392.0, + "r_y2": 324.33, + "r_x3": 392.0, + "r_y3": 277.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 8, @@ -2633,21 +2900,21 @@ "a": 255 }, "rect": { - "r_x0": 338.59, - "r_y0": 406.59, - "r_x1": 352.3, - "r_y1": 406.59, - "r_x2": 352.3, - "r_y2": 373.27, - "r_x3": 338.59, - "r_y3": 373.27, + "r_x0": 328.0, + "r_y0": 247.0, + "r_x1": 328.0, + "r_y1": 349.67, + "r_x2": 344.0, + "r_y2": 349.67, + "r_x3": 344.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 9, @@ -2658,21 +2925,21 @@ "a": 255 }, "rect": { - "r_x0": 338.59, - "r_y0": 518.61, - "r_x1": 352.3, - "r_y1": 518.61, - "r_x2": 352.3, - "r_y2": 486.9, - "r_x3": 338.59, - "r_y3": 486.9, + "r_x0": 296.67, + "r_y0": 277.33, + "r_x1": 296.67, + "r_y1": 324.33, + "r_x2": 312.67, + "r_y2": 324.33, + "r_x3": 312.67, + "r_y3": 277.33, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 10, @@ -2683,21 +2950,21 @@ "a": 255 }, "rect": { - "r_x0": 265.46, - "r_y0": 207.76, - "r_x1": 279.18, - "r_y1": 207.76, - "r_x2": 279.18, - "r_y2": 116.78, - "r_x3": 265.46, - "r_y3": 116.78, + "r_x0": 490.33, + "r_y0": 406.33, + "r_x1": 490.33, + "r_y1": 518.33, + "r_x2": 506.33, + "r_y2": 518.33, + "r_x3": 506.33, + "r_y3": 406.33, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 11, @@ -2708,21 +2975,21 @@ "a": 255 }, "rect": { - "r_x0": 265.46, - "r_y0": 299.73, - "r_x1": 279.18, - "r_y1": 299.73, - "r_x2": 279.18, - "r_y2": 251.78, - "r_x3": 265.46, - "r_y3": 251.78, + "r_x0": 459.0, + "r_y0": 429.33, + "r_x1": 459.0, + "r_y1": 499.33, + "r_x2": 475.0, + "r_y2": 499.33, + "r_x3": 475.0, + "r_y3": 429.33, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 12, @@ -2733,35 +3000,110 @@ "a": 255 }, "rect": { - "r_x0": 265.46, - "r_y0": 522.85, - "r_x1": 279.18, - "r_y1": 522.85, - "r_x2": 279.18, - "r_y2": 484.65, - "r_x3": 265.46, - "r_y3": 484.65, + "r_x0": 408.0, + "r_y0": 408.33, + "r_x1": 408.0, + "r_y1": 514.0, + "r_x2": 424.0, + "r_y2": 514.0, + "r_x3": 424.0, + "r_y3": 408.33, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 376.0, + "r_y0": 440.67, + "r_x1": 376.0, + "r_y1": 487.67, + "r_x2": 392.0, + "r_y2": 487.67, + "r_x3": 392.0, + "r_y3": 440.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + }, + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 328.0, + "r_y0": 408.33, + "r_x1": 328.0, + "r_y1": 514.0, + "r_x2": 344.0, + "r_y2": 514.0, + "r_x3": 344.0, + "r_y3": 408.33, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 296.67, + "r_y0": 440.67, + "r_x1": 296.67, + "r_y1": 487.67, + "r_x2": 312.67, + "r_y2": 487.67, + "r_x3": 312.67, + "r_y3": 440.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "children": [ { - "id": 4, + "id": 1, "label": "text", "bbox": { - "l": 474.71, - "t": 245.03, - "r": 488.43, - "b": 307.59, + "l": 485.67, + "t": 97.33, + "r": 506.33, + "b": 190.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 89.0, "cells": [ { "index": 0, @@ -2772,36 +3114,36 @@ "a": 255 }, "rect": { - "r_x0": 474.71, - "r_y0": 307.59, - "r_x1": 488.43, - "r_y1": 307.59, - "r_x2": 488.43, - "r_y2": 245.03, - "r_x3": 474.71, - "r_y3": 245.03, + "r_x0": 485.67, + "r_y0": 97.33, + "r_x1": 485.67, + "r_y1": 190.0, + "r_x2": 506.33, + "r_y2": 190.0, + "r_x3": 506.33, + "r_y3": 97.33, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 89.0, + "from_ocr": true } ], "children": [] }, { - "id": 5, + "id": 2, "label": "text", "bbox": { - "l": 474.71, - "t": 358.65, - "r": 488.43, - "b": 421.22, + "l": 454.33, + "t": 112.0, + "r": 475.0, + "b": 182.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 92.0, "cells": [ { "index": 1, @@ -2812,36 +3154,36 @@ "a": 255 }, "rect": { - "r_x0": 474.71, - "r_y0": 421.22, - "r_x1": 488.43, - "r_y1": 421.22, - "r_x2": 488.43, - "r_y2": 358.65, - "r_x3": 474.71, - "r_y3": 358.65, + "r_x0": 454.33, + "r_y0": 112.0, + "r_x1": 454.33, + "r_y1": 182.33, + "r_x2": 475.0, + "r_y2": 182.33, + "r_x3": 475.0, + "r_y3": 112.0, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true } ], "children": [] }, { - "id": 6, + "id": 3, "label": "text", "bbox": { - "l": 474.71, - "t": 472.27, - "r": 488.43, - "b": 534.84, + "l": 392.0, + "t": 121.67, + "r": 408.0, + "b": 168.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 2, @@ -2852,36 +3194,36 @@ "a": 255 }, "rect": { - "r_x0": 474.71, - "r_y0": 534.84, - "r_x1": 488.43, - "r_y1": 534.84, - "r_x2": 488.43, - "r_y2": 472.27, - "r_x3": 474.71, - "r_y3": 472.27, + "r_x0": 392.0, + "r_y0": 121.67, + "r_x1": 392.0, + "r_y1": 168.67, + "r_x2": 408.0, + "r_y2": 168.67, + "r_x3": 408.0, + "r_y3": 121.67, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true } ], "children": [] }, { - "id": 7, + "id": 4, "label": "text", "bbox": { - "l": 407.21, - "t": 123.53, - "r": 420.93, - "b": 200.67, + "l": 312.0, + "t": 121.67, + "r": 328.0, + "b": 168.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 3, @@ -2892,36 +3234,36 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 200.67, - "r_x1": 420.93, - "r_y1": 200.67, - "r_x2": 420.93, - "r_y2": 123.53, - "r_x3": 407.21, - "r_y3": 123.53, + "r_x0": 312.0, + "r_y0": 121.67, + "r_x1": 312.0, + "r_y1": 168.67, + "r_x2": 328.0, + "r_y2": 168.67, + "r_x3": 328.0, + "r_y3": 121.67, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 8, + "id": 5, "label": "text", "bbox": { - "l": 407.21, - "t": 241.65, - "r": 420.93, - "b": 310.71, + "l": 485.67, + "t": 232.67, + "r": 506.33, + "b": 364.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 92.0, "cells": [ { "index": 4, @@ -2932,36 +3274,36 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 310.71, - "r_x1": 420.93, - "r_y1": 310.71, - "r_x2": 420.93, - "r_y2": 241.65, - "r_x3": 407.21, - "r_y3": 241.65, + "r_x0": 485.67, + "r_y0": 232.67, + "r_x1": 485.67, + "r_y1": 364.0, + "r_x2": 506.33, + "r_y2": 364.0, + "r_x3": 506.33, + "r_y3": 232.67, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true } ], "children": [] }, { - "id": 9, + "id": 6, "label": "text", "bbox": { - "l": 407.21, - "t": 347.4, - "r": 420.93, - "b": 431.1, + "l": 459.0, + "t": 265.67, + "r": 475.0, + "b": 336.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 5, @@ -2972,36 +3314,36 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 431.1, - "r_x1": 420.93, - "r_y1": 431.1, - "r_x2": 420.93, - "r_y2": 347.4, - "r_x3": 407.21, - "r_y3": 347.4, + "r_x0": 459.0, + "r_y0": 265.67, + "r_x1": 459.0, + "r_y1": 336.0, + "r_x2": 475.0, + "r_y2": 336.0, + "r_x3": 475.0, + "r_y3": 265.67, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 10, + "id": 7, "label": "text", "bbox": { - "l": 407.21, - "t": 491.4, - "r": 420.93, - "b": 515.79, + "l": 408.0, + "t": 247.0, + "r": 424.0, + "b": 349.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 89.0, "cells": [ { "index": 6, @@ -3012,36 +3354,36 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 515.79, - "r_x1": 420.93, - "r_y1": 515.79, - "r_x2": 420.93, - "r_y2": 491.4, - "r_x3": 407.21, - "r_y3": 491.4, + "r_x0": 408.0, + "r_y0": 247.0, + "r_x1": 408.0, + "r_y1": 349.67, + "r_x2": 424.0, + "r_y2": 349.67, + "r_x3": 424.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 89.0, + "from_ocr": true } ], "children": [] }, { - "id": 11, + "id": 8, "label": "text", "bbox": { - "l": 338.59, - "t": 130.28, - "r": 352.3, - "b": 194.46, + "l": 376.0, + "t": 277.0, + "r": 392.0, + "b": 324.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 7, @@ -3052,36 +3394,36 @@ "a": 255 }, "rect": { - "r_x0": 338.59, - "r_y0": 194.46, - "r_x1": 352.3, - "r_y1": 194.46, - "r_x2": 352.3, - "r_y2": 130.28, - "r_x3": 338.59, - "r_y3": 130.28, + "r_x0": 376.0, + "r_y0": 277.0, + "r_x1": 376.0, + "r_y1": 324.33, + "r_x2": 392.0, + "r_y2": 324.33, + "r_x3": 392.0, + "r_y3": 277.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 12, + "id": 9, "label": "text", "bbox": { - "l": 338.59, - "t": 373.27, - "r": 352.3, - "b": 406.59, + "l": 328.0, + "t": 247.0, + "r": 344.0, + "b": 349.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 8, @@ -3092,36 +3434,36 @@ "a": 255 }, "rect": { - "r_x0": 338.59, - "r_y0": 406.59, - "r_x1": 352.3, - "r_y1": 406.59, - "r_x2": 352.3, - "r_y2": 373.27, - "r_x3": 338.59, - "r_y3": 373.27, + "r_x0": 328.0, + "r_y0": 247.0, + "r_x1": 328.0, + "r_y1": 349.67, + "r_x2": 344.0, + "r_y2": 349.67, + "r_x3": 344.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true } ], "children": [] }, { - "id": 13, + "id": 10, "label": "text", "bbox": { - "l": 338.59, - "t": 486.9, - "r": 352.3, - "b": 518.61, + "l": 296.67, + "t": 277.33, + "r": 312.67, + "b": 324.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 9, @@ -3132,36 +3474,36 @@ "a": 255 }, "rect": { - "r_x0": 338.59, - "r_y0": 518.61, - "r_x1": 352.3, - "r_y1": 518.61, - "r_x2": 352.3, - "r_y2": 486.9, - "r_x3": 338.59, - "r_y3": 486.9, + "r_x0": 296.67, + "r_y0": 277.33, + "r_x1": 296.67, + "r_y1": 324.33, + "r_x2": 312.67, + "r_y2": 324.33, + "r_x3": 312.67, + "r_y3": 277.33, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 14, + "id": 11, "label": "text", "bbox": { - "l": 265.46, - "t": 116.78, - "r": 279.18, - "b": 207.76, + "l": 490.33, + "t": 406.33, + "r": 506.33, + "b": 518.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 10, @@ -3172,36 +3514,36 @@ "a": 255 }, "rect": { - "r_x0": 265.46, - "r_y0": 207.76, - "r_x1": 279.18, - "r_y1": 207.76, - "r_x2": 279.18, - "r_y2": 116.78, - "r_x3": 265.46, - "r_y3": 116.78, + "r_x0": 490.33, + "r_y0": 406.33, + "r_x1": 490.33, + "r_y1": 518.33, + "r_x2": 506.33, + "r_y2": 518.33, + "r_x3": 506.33, + "r_y3": 406.33, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true } ], "children": [] }, { - "id": 15, + "id": 12, "label": "text", "bbox": { - "l": 265.46, - "t": 251.78, - "r": 279.18, - "b": 299.73, + "l": 459.0, + "t": 429.33, + "r": 475.0, + "b": 499.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 11, @@ -3212,36 +3554,36 @@ "a": 255 }, "rect": { - "r_x0": 265.46, - "r_y0": 299.73, - "r_x1": 279.18, - "r_y1": 299.73, - "r_x2": 279.18, - "r_y2": 251.78, - "r_x3": 265.46, - "r_y3": 251.78, + "r_x0": 459.0, + "r_y0": 429.33, + "r_x1": 459.0, + "r_y1": 499.33, + "r_x2": 475.0, + "r_y2": 499.33, + "r_x3": 475.0, + "r_y3": 429.33, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 16, + "id": 13, "label": "text", "bbox": { - "l": 265.46, - "t": 484.65, - "r": 279.18, - "b": 522.85, + "l": 408.0, + "t": 408.33, + "r": 424.0, + "b": 514.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 12, @@ -3252,21 +3594,141 @@ "a": 255 }, "rect": { - "r_x0": 265.46, - "r_y0": 522.85, - "r_x1": 279.18, - "r_y1": 522.85, - "r_x2": 279.18, - "r_y2": 484.65, - "r_x3": 265.46, - "r_y3": 484.65, + "r_x0": 408.0, + "r_y0": 408.33, + "r_x1": 408.0, + "r_y1": 514.0, + "r_x2": 424.0, + "r_y2": 514.0, + "r_x3": 424.0, + "r_y3": 408.33, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 14, + "label": "text", + "bbox": { + "l": 376.0, + "t": 440.67, + "r": 392.0, + "b": 487.67, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 376.0, + "r_y0": 440.67, + "r_x1": 376.0, + "r_y1": 487.67, + "r_x2": 392.0, + "r_y2": 487.67, + "r_x3": 392.0, + "r_y3": 440.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 15, + "label": "text", + "bbox": { + "l": 328.0, + "t": 408.33, + "r": 344.0, + "b": 514.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 328.0, + "r_y0": 408.33, + "r_x1": 328.0, + "r_y1": 514.0, + "r_x2": 344.0, + "r_y2": 514.0, + "r_x3": 344.0, + "r_y3": 408.33, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 16, + "label": "text", + "bbox": { + "l": 296.67, + "t": 440.67, + "r": 312.67, + "b": 487.67, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 296.67, + "r_y0": 440.67, + "r_x1": 296.67, + "r_y1": 487.67, + "r_x2": 312.67, + "r_y2": 487.67, + "r_x3": 312.67, + "r_y3": 440.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "children": [] @@ -3275,93 +3737,28 @@ }, "text": null, "otsl_seq": [ - "fcel", - "fcel", - "fcel", - "ecel", + "ched", + "ched", + "ched", "nl", "fcel", - "ecel", - "fcel", - "fcel", - "nl", - "ecel", - "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", - "fcel", "nl" ], - "num_rows": 4, - "num_cols": 4, + "num_rows": 1, + "num_cols": 3, "table_cells": [ { "bbox": { - "l": 474.71, - "t": 245.03, - "r": 488.43, - "b": 307.59, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "Column 0", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 474.71, - "t": 358.65, - "r": 488.43, - "b": 421.22, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "Column 1", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 474.71, - "t": 472.27, - "r": 488.43, - "b": 534.84, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "Column 2", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 407.21, - "t": 123.53, - "r": 420.93, - "b": 200.67, + "l": 443.33, + "t": 312.0, + "r": 490.33, + "b": 328.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -3370,74 +3767,17 @@ "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, - "text": "this is row 0", + "text": "value", "column_header": false, "row_header": false, "row_section": false }, { "bbox": { - "l": 407.21, - "t": 241.65, - "r": 420.93, - "b": 310.71, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "some cells", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 407.21, - "t": 347.4, - "r": 420.93, - "b": 431.1, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "have content", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 407.21, - "t": 491.4, - "r": 420.93, - "b": 515.79, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "and", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 338.59, - "t": 130.28, - "r": 352.3, - "b": 194.46, + "l": 262.33, + "t": 296.67, + "r": 365.0, + "b": 344.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -3446,55 +3786,17 @@ "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, - "text": "and row 1", + "text": "Some other value", "column_header": false, "row_header": false, "row_section": false }, { "bbox": { - "l": 338.59, - "t": 373.27, - "r": 352.3, - "b": 406.59, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "other", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 338.59, - "t": 486.9, - "r": 352.3, - "b": 518.61, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "have", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 265.46, - "t": 116.78, - "r": 279.18, - "b": 207.76, + "l": 98.0, + "t": 296.67, + "r": 203.67, + "b": 344.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -3503,45 +3805,7 @@ "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, - "text": "and last row 2", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 265.46, - "t": 251.78, - "r": 279.18, - "b": 299.73, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "nothing", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 265.46, - "t": 484.65, - "r": 279.18, - "b": 522.85, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "inside", + "text": "Yet another value", "column_header": false, "row_header": false, "row_section": false @@ -3558,13 +3822,13 @@ "id": 0, "label": "table", "bbox": { - "l": 233.88, - "t": 102.98, - "r": 519.9, - "b": 561.04, + "l": 277.42, + "t": 69.04, + "r": 524.35, + "b": 551.1, "coord_origin": "TOPLEFT" }, - "confidence": 0.967, + "confidence": 0.979, "cells": [ { "index": 0, @@ -3575,21 +3839,21 @@ "a": 255 }, "rect": { - "r_x0": 474.71, - "r_y0": 307.59, - "r_x1": 488.43, - "r_y1": 307.59, - "r_x2": 488.43, - "r_y2": 245.03, - "r_x3": 474.71, - "r_y3": 245.03, + "r_x0": 485.67, + "r_y0": 97.33, + "r_x1": 485.67, + "r_y1": 190.0, + "r_x2": 506.33, + "r_y2": 190.0, + "r_x3": 506.33, + "r_y3": 97.33, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 89.0, + "from_ocr": true }, { "index": 1, @@ -3600,21 +3864,21 @@ "a": 255 }, "rect": { - "r_x0": 474.71, - "r_y0": 421.22, - "r_x1": 488.43, - "r_y1": 421.22, - "r_x2": 488.43, - "r_y2": 358.65, - "r_x3": 474.71, - "r_y3": 358.65, + "r_x0": 454.33, + "r_y0": 112.0, + "r_x1": 454.33, + "r_y1": 182.33, + "r_x2": 475.0, + "r_y2": 182.33, + "r_x3": 475.0, + "r_y3": 112.0, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 2, @@ -3625,21 +3889,21 @@ "a": 255 }, "rect": { - "r_x0": 474.71, - "r_y0": 534.84, - "r_x1": 488.43, - "r_y1": 534.84, - "r_x2": 488.43, - "r_y2": 472.27, - "r_x3": 474.71, - "r_y3": 472.27, + "r_x0": 392.0, + "r_y0": 121.67, + "r_x1": 392.0, + "r_y1": 168.67, + "r_x2": 408.0, + "r_y2": 168.67, + "r_x3": 408.0, + "r_y3": 121.67, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 3, @@ -3650,21 +3914,21 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 200.67, - "r_x1": 420.93, - "r_y1": 200.67, - "r_x2": 420.93, - "r_y2": 123.53, - "r_x3": 407.21, - "r_y3": 123.53, + "r_x0": 312.0, + "r_y0": 121.67, + "r_x1": 312.0, + "r_y1": 168.67, + "r_x2": 328.0, + "r_y2": 168.67, + "r_x3": 328.0, + "r_y3": 121.67, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 4, @@ -3675,21 +3939,21 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 310.71, - "r_x1": 420.93, - "r_y1": 310.71, - "r_x2": 420.93, - "r_y2": 241.65, - "r_x3": 407.21, - "r_y3": 241.65, + "r_x0": 485.67, + "r_y0": 232.67, + "r_x1": 485.67, + "r_y1": 364.0, + "r_x2": 506.33, + "r_y2": 364.0, + "r_x3": 506.33, + "r_y3": 232.67, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 5, @@ -3700,21 +3964,21 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 431.1, - "r_x1": 420.93, - "r_y1": 431.1, - "r_x2": 420.93, - "r_y2": 347.4, - "r_x3": 407.21, - "r_y3": 347.4, + "r_x0": 459.0, + "r_y0": 265.67, + "r_x1": 459.0, + "r_y1": 336.0, + "r_x2": 475.0, + "r_y2": 336.0, + "r_x3": 475.0, + "r_y3": 265.67, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 6, @@ -3725,21 +3989,21 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 515.79, - "r_x1": 420.93, - "r_y1": 515.79, - "r_x2": 420.93, - "r_y2": 491.4, - "r_x3": 407.21, - "r_y3": 491.4, + "r_x0": 408.0, + "r_y0": 247.0, + "r_x1": 408.0, + "r_y1": 349.67, + "r_x2": 424.0, + "r_y2": 349.67, + "r_x3": 424.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 89.0, + "from_ocr": true }, { "index": 7, @@ -3750,21 +4014,21 @@ "a": 255 }, "rect": { - "r_x0": 338.59, - "r_y0": 194.46, - "r_x1": 352.3, - "r_y1": 194.46, - "r_x2": 352.3, - "r_y2": 130.28, - "r_x3": 338.59, - "r_y3": 130.28, + "r_x0": 376.0, + "r_y0": 277.0, + "r_x1": 376.0, + "r_y1": 324.33, + "r_x2": 392.0, + "r_y2": 324.33, + "r_x3": 392.0, + "r_y3": 277.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 8, @@ -3775,21 +4039,21 @@ "a": 255 }, "rect": { - "r_x0": 338.59, - "r_y0": 406.59, - "r_x1": 352.3, - "r_y1": 406.59, - "r_x2": 352.3, - "r_y2": 373.27, - "r_x3": 338.59, - "r_y3": 373.27, + "r_x0": 328.0, + "r_y0": 247.0, + "r_x1": 328.0, + "r_y1": 349.67, + "r_x2": 344.0, + "r_y2": 349.67, + "r_x3": 344.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 9, @@ -3800,21 +4064,21 @@ "a": 255 }, "rect": { - "r_x0": 338.59, - "r_y0": 518.61, - "r_x1": 352.3, - "r_y1": 518.61, - "r_x2": 352.3, - "r_y2": 486.9, - "r_x3": 338.59, - "r_y3": 486.9, + "r_x0": 296.67, + "r_y0": 277.33, + "r_x1": 296.67, + "r_y1": 324.33, + "r_x2": 312.67, + "r_y2": 324.33, + "r_x3": 312.67, + "r_y3": 277.33, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 10, @@ -3825,21 +4089,21 @@ "a": 255 }, "rect": { - "r_x0": 265.46, - "r_y0": 207.76, - "r_x1": 279.18, - "r_y1": 207.76, - "r_x2": 279.18, - "r_y2": 116.78, - "r_x3": 265.46, - "r_y3": 116.78, + "r_x0": 490.33, + "r_y0": 406.33, + "r_x1": 490.33, + "r_y1": 518.33, + "r_x2": 506.33, + "r_y2": 518.33, + "r_x3": 506.33, + "r_y3": 406.33, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 11, @@ -3850,21 +4114,21 @@ "a": 255 }, "rect": { - "r_x0": 265.46, - "r_y0": 299.73, - "r_x1": 279.18, - "r_y1": 299.73, - "r_x2": 279.18, - "r_y2": 251.78, - "r_x3": 265.46, - "r_y3": 251.78, + "r_x0": 459.0, + "r_y0": 429.33, + "r_x1": 459.0, + "r_y1": 499.33, + "r_x2": 475.0, + "r_y2": 499.33, + "r_x3": 475.0, + "r_y3": 429.33, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 12, @@ -3875,35 +4139,110 @@ "a": 255 }, "rect": { - "r_x0": 265.46, - "r_y0": 522.85, - "r_x1": 279.18, - "r_y1": 522.85, - "r_x2": 279.18, - "r_y2": 484.65, - "r_x3": 265.46, - "r_y3": 484.65, + "r_x0": 408.0, + "r_y0": 408.33, + "r_x1": 408.0, + "r_y1": 514.0, + "r_x2": 424.0, + "r_y2": 514.0, + "r_x3": 424.0, + "r_y3": 408.33, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 376.0, + "r_y0": 440.67, + "r_x1": 376.0, + "r_y1": 487.67, + "r_x2": 392.0, + "r_y2": 487.67, + "r_x3": 392.0, + "r_y3": 440.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + }, + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 328.0, + "r_y0": 408.33, + "r_x1": 328.0, + "r_y1": 514.0, + "r_x2": 344.0, + "r_y2": 514.0, + "r_x3": 344.0, + "r_y3": 408.33, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 296.67, + "r_y0": 440.67, + "r_x1": 296.67, + "r_y1": 487.67, + "r_x2": 312.67, + "r_y2": 487.67, + "r_x3": 312.67, + "r_y3": 440.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "children": [ { - "id": 4, + "id": 1, "label": "text", "bbox": { - "l": 474.71, - "t": 245.03, - "r": 488.43, - "b": 307.59, + "l": 485.67, + "t": 97.33, + "r": 506.33, + "b": 190.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 89.0, "cells": [ { "index": 0, @@ -3914,36 +4253,36 @@ "a": 255 }, "rect": { - "r_x0": 474.71, - "r_y0": 307.59, - "r_x1": 488.43, - "r_y1": 307.59, - "r_x2": 488.43, - "r_y2": 245.03, - "r_x3": 474.71, - "r_y3": 245.03, + "r_x0": 485.67, + "r_y0": 97.33, + "r_x1": 485.67, + "r_y1": 190.0, + "r_x2": 506.33, + "r_y2": 190.0, + "r_x3": 506.33, + "r_y3": 97.33, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 89.0, + "from_ocr": true } ], "children": [] }, { - "id": 5, + "id": 2, "label": "text", "bbox": { - "l": 474.71, - "t": 358.65, - "r": 488.43, - "b": 421.22, + "l": 454.33, + "t": 112.0, + "r": 475.0, + "b": 182.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 92.0, "cells": [ { "index": 1, @@ -3954,36 +4293,36 @@ "a": 255 }, "rect": { - "r_x0": 474.71, - "r_y0": 421.22, - "r_x1": 488.43, - "r_y1": 421.22, - "r_x2": 488.43, - "r_y2": 358.65, - "r_x3": 474.71, - "r_y3": 358.65, + "r_x0": 454.33, + "r_y0": 112.0, + "r_x1": 454.33, + "r_y1": 182.33, + "r_x2": 475.0, + "r_y2": 182.33, + "r_x3": 475.0, + "r_y3": 112.0, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true } ], "children": [] }, { - "id": 6, + "id": 3, "label": "text", "bbox": { - "l": 474.71, - "t": 472.27, - "r": 488.43, - "b": 534.84, + "l": 392.0, + "t": 121.67, + "r": 408.0, + "b": 168.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 2, @@ -3994,36 +4333,36 @@ "a": 255 }, "rect": { - "r_x0": 474.71, - "r_y0": 534.84, - "r_x1": 488.43, - "r_y1": 534.84, - "r_x2": 488.43, - "r_y2": 472.27, - "r_x3": 474.71, - "r_y3": 472.27, + "r_x0": 392.0, + "r_y0": 121.67, + "r_x1": 392.0, + "r_y1": 168.67, + "r_x2": 408.0, + "r_y2": 168.67, + "r_x3": 408.0, + "r_y3": 121.67, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true } ], "children": [] }, { - "id": 7, + "id": 4, "label": "text", "bbox": { - "l": 407.21, - "t": 123.53, - "r": 420.93, - "b": 200.67, + "l": 312.0, + "t": 121.67, + "r": 328.0, + "b": 168.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 3, @@ -4034,36 +4373,36 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 200.67, - "r_x1": 420.93, - "r_y1": 200.67, - "r_x2": 420.93, - "r_y2": 123.53, - "r_x3": 407.21, - "r_y3": 123.53, + "r_x0": 312.0, + "r_y0": 121.67, + "r_x1": 312.0, + "r_y1": 168.67, + "r_x2": 328.0, + "r_y2": 168.67, + "r_x3": 328.0, + "r_y3": 121.67, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 8, + "id": 5, "label": "text", "bbox": { - "l": 407.21, - "t": 241.65, - "r": 420.93, - "b": 310.71, + "l": 485.67, + "t": 232.67, + "r": 506.33, + "b": 364.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 92.0, "cells": [ { "index": 4, @@ -4074,36 +4413,36 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 310.71, - "r_x1": 420.93, - "r_y1": 310.71, - "r_x2": 420.93, - "r_y2": 241.65, - "r_x3": 407.21, - "r_y3": 241.65, + "r_x0": 485.67, + "r_y0": 232.67, + "r_x1": 485.67, + "r_y1": 364.0, + "r_x2": 506.33, + "r_y2": 364.0, + "r_x3": 506.33, + "r_y3": 232.67, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true } ], "children": [] }, { - "id": 9, + "id": 6, "label": "text", "bbox": { - "l": 407.21, - "t": 347.4, - "r": 420.93, - "b": 431.1, + "l": 459.0, + "t": 265.67, + "r": 475.0, + "b": 336.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 5, @@ -4114,36 +4453,36 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 431.1, - "r_x1": 420.93, - "r_y1": 431.1, - "r_x2": 420.93, - "r_y2": 347.4, - "r_x3": 407.21, - "r_y3": 347.4, + "r_x0": 459.0, + "r_y0": 265.67, + "r_x1": 459.0, + "r_y1": 336.0, + "r_x2": 475.0, + "r_y2": 336.0, + "r_x3": 475.0, + "r_y3": 265.67, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 10, + "id": 7, "label": "text", "bbox": { - "l": 407.21, - "t": 491.4, - "r": 420.93, - "b": 515.79, + "l": 408.0, + "t": 247.0, + "r": 424.0, + "b": 349.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 89.0, "cells": [ { "index": 6, @@ -4154,36 +4493,36 @@ "a": 255 }, "rect": { - "r_x0": 407.21, - "r_y0": 515.79, - "r_x1": 420.93, - "r_y1": 515.79, - "r_x2": 420.93, - "r_y2": 491.4, - "r_x3": 407.21, - "r_y3": 491.4, + "r_x0": 408.0, + "r_y0": 247.0, + "r_x1": 408.0, + "r_y1": 349.67, + "r_x2": 424.0, + "r_y2": 349.67, + "r_x3": 424.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 89.0, + "from_ocr": true } ], "children": [] }, { - "id": 11, + "id": 8, "label": "text", "bbox": { - "l": 338.59, - "t": 130.28, - "r": 352.3, - "b": 194.46, + "l": 376.0, + "t": 277.0, + "r": 392.0, + "b": 324.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 7, @@ -4194,36 +4533,36 @@ "a": 255 }, "rect": { - "r_x0": 338.59, - "r_y0": 194.46, - "r_x1": 352.3, - "r_y1": 194.46, - "r_x2": 352.3, - "r_y2": 130.28, - "r_x3": 338.59, - "r_y3": 130.28, + "r_x0": 376.0, + "r_y0": 277.0, + "r_x1": 376.0, + "r_y1": 324.33, + "r_x2": 392.0, + "r_y2": 324.33, + "r_x3": 392.0, + "r_y3": 277.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 12, + "id": 9, "label": "text", "bbox": { - "l": 338.59, - "t": 373.27, - "r": 352.3, - "b": 406.59, + "l": 328.0, + "t": 247.0, + "r": 344.0, + "b": 349.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 8, @@ -4234,36 +4573,36 @@ "a": 255 }, "rect": { - "r_x0": 338.59, - "r_y0": 406.59, - "r_x1": 352.3, - "r_y1": 406.59, - "r_x2": 352.3, - "r_y2": 373.27, - "r_x3": 338.59, - "r_y3": 373.27, + "r_x0": 328.0, + "r_y0": 247.0, + "r_x1": 328.0, + "r_y1": 349.67, + "r_x2": 344.0, + "r_y2": 349.67, + "r_x3": 344.0, + "r_y3": 247.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true } ], "children": [] }, { - "id": 13, + "id": 10, "label": "text", "bbox": { - "l": 338.59, - "t": 486.9, - "r": 352.3, - "b": 518.61, + "l": 296.67, + "t": 277.33, + "r": 312.67, + "b": 324.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 9, @@ -4274,36 +4613,36 @@ "a": 255 }, "rect": { - "r_x0": 338.59, - "r_y0": 518.61, - "r_x1": 352.3, - "r_y1": 518.61, - "r_x2": 352.3, - "r_y2": 486.9, - "r_x3": 338.59, - "r_y3": 486.9, + "r_x0": 296.67, + "r_y0": 277.33, + "r_x1": 296.67, + "r_y1": 324.33, + "r_x2": 312.67, + "r_y2": 324.33, + "r_x3": 312.67, + "r_y3": 277.33, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 14, + "id": 11, "label": "text", "bbox": { - "l": 265.46, - "t": 116.78, - "r": 279.18, - "b": 207.76, + "l": 490.33, + "t": 406.33, + "r": 506.33, + "b": 518.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 10, @@ -4314,36 +4653,36 @@ "a": 255 }, "rect": { - "r_x0": 265.46, - "r_y0": 207.76, - "r_x1": 279.18, - "r_y1": 207.76, - "r_x2": 279.18, - "r_y2": 116.78, - "r_x3": 265.46, - "r_y3": 116.78, + "r_x0": 490.33, + "r_y0": 406.33, + "r_x1": 490.33, + "r_y1": 518.33, + "r_x2": 506.33, + "r_y2": 518.33, + "r_x3": 506.33, + "r_y3": 406.33, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true } ], "children": [] }, { - "id": 15, + "id": 12, "label": "text", "bbox": { - "l": 265.46, - "t": 251.78, - "r": 279.18, - "b": 299.73, + "l": 459.0, + "t": 429.33, + "r": 475.0, + "b": 499.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 11, @@ -4354,36 +4693,36 @@ "a": 255 }, "rect": { - "r_x0": 265.46, - "r_y0": 299.73, - "r_x1": 279.18, - "r_y1": 299.73, - "r_x2": 279.18, - "r_y2": 251.78, - "r_x3": 265.46, - "r_y3": 251.78, + "r_x0": 459.0, + "r_y0": 429.33, + "r_x1": 459.0, + "r_y1": 499.33, + "r_x2": 475.0, + "r_y2": 499.33, + "r_x3": 475.0, + "r_y3": 429.33, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 16, + "id": 13, "label": "text", "bbox": { - "l": 265.46, - "t": 484.65, - "r": 279.18, - "b": 522.85, + "l": 408.0, + "t": 408.33, + "r": 424.0, + "b": 514.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 12, @@ -4394,21 +4733,141 @@ "a": 255 }, "rect": { - "r_x0": 265.46, - "r_y0": 522.85, - "r_x1": 279.18, - "r_y1": 522.85, - "r_x2": 279.18, - "r_y2": 484.65, - "r_x3": 265.46, - "r_y3": 484.65, + "r_x0": 408.0, + "r_y0": 408.33, + "r_x1": 408.0, + "r_y1": 514.0, + "r_x2": 424.0, + "r_y2": 514.0, + "r_x3": 424.0, + "r_y3": 408.33, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 14, + "label": "text", + "bbox": { + "l": 376.0, + "t": 440.67, + "r": 392.0, + "b": 487.67, + "coord_origin": "TOPLEFT" + }, + "confidence": 96.0, + "cells": [ + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 376.0, + "r_y0": 440.67, + "r_x1": 376.0, + "r_y1": 487.67, + "r_x2": 392.0, + "r_y2": 487.67, + "r_x3": 392.0, + "r_y3": 440.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 96.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 15, + "label": "text", + "bbox": { + "l": 328.0, + "t": 408.33, + "r": 344.0, + "b": 514.0, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 328.0, + "r_y0": 408.33, + "r_x1": 328.0, + "r_y1": 514.0, + "r_x2": 344.0, + "r_y2": 514.0, + "r_x3": 344.0, + "r_y3": 408.33, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 16, + "label": "text", + "bbox": { + "l": 296.67, + "t": 440.67, + "r": 312.67, + "b": 487.67, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 296.67, + "r_y0": 440.67, + "r_x1": 296.67, + "r_y1": 487.67, + "r_x2": 312.67, + "r_y2": 487.67, + "r_x3": 312.67, + "r_y3": 440.67, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "children": [] @@ -4417,93 +4876,28 @@ }, "text": null, "otsl_seq": [ - "fcel", - "fcel", - "fcel", - "ecel", + "ched", + "ched", + "ched", "nl", "fcel", - "ecel", - "fcel", - "fcel", - "nl", - "ecel", - "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", - "fcel", "nl" ], - "num_rows": 4, - "num_cols": 4, + "num_rows": 1, + "num_cols": 3, "table_cells": [ { "bbox": { - "l": 474.71, - "t": 245.03, - "r": 488.43, - "b": 307.59, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "Column 0", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 474.71, - "t": 358.65, - "r": 488.43, - "b": 421.22, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "Column 1", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 474.71, - "t": 472.27, - "r": 488.43, - "b": 534.84, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "Column 2", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 407.21, - "t": 123.53, - "r": 420.93, - "b": 200.67, + "l": 443.33, + "t": 312.0, + "r": 490.33, + "b": 328.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -4512,74 +4906,17 @@ "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, - "text": "this is row 0", + "text": "value", "column_header": false, "row_header": false, "row_section": false }, { "bbox": { - "l": 407.21, - "t": 241.65, - "r": 420.93, - "b": 310.71, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "some cells", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 407.21, - "t": 347.4, - "r": 420.93, - "b": 431.1, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "have content", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 407.21, - "t": 491.4, - "r": 420.93, - "b": 515.79, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "and", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 338.59, - "t": 130.28, - "r": 352.3, - "b": 194.46, + "l": 262.33, + "t": 296.67, + "r": 365.0, + "b": 344.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -4588,55 +4925,17 @@ "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, - "text": "and row 1", + "text": "Some other value", "column_header": false, "row_header": false, "row_section": false }, { "bbox": { - "l": 338.59, - "t": 373.27, - "r": 352.3, - "b": 406.59, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "other", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 338.59, - "t": 486.9, - "r": 352.3, - "b": 518.61, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "have", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 265.46, - "t": 116.78, - "r": 279.18, - "b": 207.76, + "l": 98.0, + "t": 296.67, + "r": 203.67, + "b": 344.0, "coord_origin": "TOPLEFT" }, "row_span": 1, @@ -4645,45 +4944,7 @@ "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, - "text": "and last row 2", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 265.46, - "t": 251.78, - "r": 279.18, - "b": 299.73, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "nothing", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 265.46, - "t": 484.65, - "r": 279.18, - "b": 522.85, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "inside", + "text": "Yet another value", "column_header": false, "row_header": false, "row_section": false diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_90.doctags.txt b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_90.doctags.txt index b8f362fc..0b13f376 100644 --- a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_90.doctags.txt +++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_90.doctags.txt @@ -1,2 +1,2 @@ -Column 2andhaveinsideColumn 1have contentotherColumn 0some cellsnothingthis is row 0and row 1and last row 2 + \ No newline at end of file diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_90.json b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_90.json index 19e3d0e1..dd589a5b 100644 --- a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_90.json +++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_90.json @@ -4,7 +4,7 @@ "name": "ocr_test_rotated_90", "origin": { "mimetype": "application/pdf", - "binary_hash": 18214570700708620554, + "binary_hash": 6752841177619701916, "filename": "ocr_test_rotated_90.pdf" }, "furniture": { @@ -41,10 +41,10 @@ { "page_no": 1, "bbox": { - "l": 75.13, - "t": 562.14, - "r": 361.19, - "b": 103.0, + "l": 87.65, + "t": 551.1, + "r": 334.58, + "b": 69.04, "coord_origin": "BOTTOMLEFT" }, "charspan": [ @@ -57,550 +57,10 @@ "references": [], "footnotes": [], "data": { - "table_cells": [ - { - "bbox": { - "l": 106.57, - "t": 534.41, - "r": 120.29, - "b": 596.98, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "Column 0", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 106.57, - "t": 420.78, - "r": 120.29, - "b": 483.35, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "Column 1", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 106.57, - "t": 307.16, - "r": 120.29, - "b": 369.73, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "Column 2", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 174.07, - "t": 641.33, - "r": 187.79, - "b": 718.48, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "this is row 0", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 174.07, - "t": 531.29, - "r": 187.79, - "b": 600.35, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "some cells", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 174.07, - "t": 410.9, - "r": 187.79, - "b": 494.6, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "have content", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 174.07, - "t": 326.21, - "r": 187.79, - "b": 350.6, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "and", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 242.7, - "t": 647.54, - "r": 256.41, - "b": 711.73, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "and row 1", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 242.7, - "t": 435.41, - "r": 256.41, - "b": 468.73, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "other", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 242.7, - "t": 323.39, - "r": 256.41, - "b": 355.1, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "have", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 315.82, - "t": 634.24, - "r": 329.54, - "b": 725.23, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "and last row 2", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 315.82, - "t": 542.27, - "r": 329.54, - "b": 590.23, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "nothing", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 315.82, - "t": 319.15, - "r": 329.54, - "b": 357.35, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "inside", - "column_header": false, - "row_header": false, - "row_section": false - } - ], - "num_rows": 4, - "num_cols": 4, - "grid": [ - [ - { - "bbox": { - "l": 106.57, - "t": 307.16, - "r": 120.29, - "b": 369.73, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "Column 2", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 174.07, - "t": 326.21, - "r": 187.79, - "b": 350.6, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "and", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 242.7, - "t": 323.39, - "r": 256.41, - "b": 355.1, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "have", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 315.82, - "t": 319.15, - "r": 329.54, - "b": 357.35, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "inside", - "column_header": false, - "row_header": false, - "row_section": false - } - ], - [ - { - "bbox": { - "l": 106.57, - "t": 420.78, - "r": 120.29, - "b": 483.35, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "Column 1", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 174.07, - "t": 410.9, - "r": 187.79, - "b": 494.6, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "have content", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 242.7, - "t": 435.41, - "r": 256.41, - "b": 468.73, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "other", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "", - "column_header": false, - "row_header": false, - "row_section": false - } - ], - [ - { - "bbox": { - "l": 106.57, - "t": 534.41, - "r": 120.29, - "b": 596.98, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "Column 0", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 174.07, - "t": 531.29, - "r": 187.79, - "b": 600.35, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "some cells", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 315.82, - "t": 542.27, - "r": 329.54, - "b": 590.23, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "nothing", - "column_header": false, - "row_header": false, - "row_section": false - } - ], - [ - { - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 174.07, - "t": 641.33, - "r": 187.79, - "b": 718.48, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "this is row 0", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 242.7, - "t": 647.54, - "r": 256.41, - "b": 711.73, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "and row 1", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 315.82, - "t": 634.24, - "r": 329.54, - "b": 725.23, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "and last row 2", - "column_header": false, - "row_header": false, - "row_section": false - } - ] - ] + "table_cells": [], + "num_rows": 0, + "num_cols": 0, + "grid": [] }, "annotations": [] } @@ -610,8 +70,8 @@ "pages": { "1": { "size": { - "width": 595.0, - "height": 842.0 + "width": 612.0, + "height": 792.0 }, "page_no": 1 } diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_90.md b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_90.md index a45b3c36..e69de29b 100644 --- a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_90.md +++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_90.md @@ -1,5 +0,0 @@ -| Column 2 | and | have | inside | -|------------|---------------|-----------|----------------| -| Column 1 | have content | other | | -| Column 0 | some cells | | nothing | -| | this is row 0 | and row 1 | and last row 2 | \ No newline at end of file diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_90.pages.json b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_90.pages.json index cff232ce..186a44d5 100644 --- a/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_90.pages.json +++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test_rotated_90.pages.json @@ -2,8 +2,8 @@ { "page_no": 0, "size": { - "width": 595.0, - "height": 842.0 + "width": 612.0, + "height": 792.0 }, "parsed_page": { "dimension": { @@ -11,47 +11,47 @@ "rect": { "r_x0": 0.0, "r_y0": 0.0, - "r_x1": 842.0, + "r_x1": 792.0, "r_y1": 0.0, - "r_x2": 842.0, - "r_y2": 595.0, + "r_x2": 792.0, + "r_y2": 612.0, "r_x3": 0.0, - "r_y3": 595.0, + "r_y3": 612.0, "coord_origin": "BOTTOMLEFT" }, "boundary_type": "crop_box", "art_bbox": { "l": 0.0, - "t": 595.0, - "r": 842.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" }, "bleed_bbox": { "l": 0.0, - "t": 595.0, - "r": 842.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" }, "crop_bbox": { "l": 0.0, - "t": 595.0, - "r": 842.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" }, "media_bbox": { "l": 0.0, - "t": 595.0, - "r": 842.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" }, "trim_bbox": { "l": 0.0, - "t": 595.0, - "r": 842.0, + "t": 612.0, + "r": 792.0, "b": 0.0, "coord_origin": "BOTTOMLEFT" } @@ -69,21 +69,21 @@ "a": 255 }, "rect": { - "r_x0": 106.57, - "r_y0": 596.98, - "r_x1": 120.29, - "r_y1": 596.98, - "r_x2": 120.29, - "r_y2": 534.41, - "r_x3": 106.57, - "r_y3": 534.41, + "r_x0": 126.33, + "r_y0": 694.67, + "r_x1": 126.33, + "r_y1": 602.0, + "r_x2": 105.67, + "r_y2": 602.0, + "r_x3": 105.67, + "r_y3": 694.67, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true }, { "index": 1, @@ -94,21 +94,21 @@ "a": 255 }, "rect": { - "r_x0": 106.57, - "r_y0": 483.35, - "r_x1": 120.29, - "r_y1": 483.35, - "r_x2": 120.29, - "r_y2": 420.78, - "r_x3": 106.57, - "r_y3": 420.78, + "r_x0": 157.67, + "r_y0": 680.33, + "r_x1": 157.67, + "r_y1": 610.0, + "r_x2": 137.0, + "r_y2": 610.0, + "r_x3": 137.0, + "r_y3": 680.33, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 2, @@ -119,21 +119,21 @@ "a": 255 }, "rect": { - "r_x0": 106.57, - "r_y0": 369.73, - "r_x1": 120.29, - "r_y1": 369.73, - "r_x2": 120.29, - "r_y2": 307.16, - "r_x3": 106.57, - "r_y3": 307.16, + "r_x0": 220.0, + "r_y0": 670.33, + "r_x1": 220.0, + "r_y1": 623.33, + "r_x2": 204.0, + "r_y2": 623.33, + "r_x3": 204.0, + "r_y3": 670.33, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 3, @@ -144,21 +144,21 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 718.48, - "r_x1": 187.79, - "r_y1": 718.48, - "r_x2": 187.79, - "r_y2": 641.33, - "r_x3": 174.07, - "r_y3": 641.33, + "r_x0": 300.0, + "r_y0": 670.33, + "r_x1": 300.0, + "r_y1": 623.33, + "r_x2": 284.0, + "r_y2": 623.33, + "r_x3": 284.0, + "r_y3": 670.33, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 4, @@ -169,21 +169,21 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 600.35, - "r_x1": 187.79, - "r_y1": 600.35, - "r_x2": 187.79, - "r_y2": 531.29, - "r_x3": 174.07, - "r_y3": 531.29, + "r_x0": 126.33, + "r_y0": 559.67, + "r_x1": 126.33, + "r_y1": 428.0, + "r_x2": 105.67, + "r_y2": 428.0, + "r_x3": 105.67, + "r_y3": 559.67, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 91.0, + "from_ocr": true }, { "index": 5, @@ -194,21 +194,21 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 494.6, - "r_x1": 187.79, - "r_y1": 494.6, - "r_x2": 187.79, - "r_y2": 410.9, - "r_x3": 174.07, - "r_y3": 410.9, + "r_x0": 153.0, + "r_y0": 526.67, + "r_x1": 153.0, + "r_y1": 456.0, + "r_x2": 137.0, + "r_y2": 456.0, + "r_x3": 137.0, + "r_y3": 526.67, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 6, @@ -219,21 +219,21 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 350.6, - "r_x1": 187.79, - "r_y1": 350.6, - "r_x2": 187.79, - "r_y2": 326.21, - "r_x3": 174.07, - "r_y3": 326.21, + "r_x0": 204.33, + "r_y0": 545.0, + "r_x1": 204.33, + "r_y1": 442.33, + "r_x2": 188.33, + "r_y2": 442.33, + "r_x3": 188.33, + "r_y3": 545.0, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 7, @@ -244,21 +244,21 @@ "a": 255 }, "rect": { - "r_x0": 242.7, - "r_y0": 711.73, - "r_x1": 256.41, - "r_y1": 711.73, - "r_x2": 256.41, - "r_y2": 647.54, - "r_x3": 242.7, - "r_y3": 647.54, + "r_x0": 236.0, + "r_y0": 515.0, + "r_x1": 236.0, + "r_y1": 468.0, + "r_x2": 220.0, + "r_y2": 468.0, + "r_x3": 220.0, + "r_y3": 515.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 8, @@ -269,21 +269,21 @@ "a": 255 }, "rect": { - "r_x0": 242.7, - "r_y0": 468.73, - "r_x1": 256.41, - "r_y1": 468.73, - "r_x2": 256.41, - "r_y2": 435.41, - "r_x3": 242.7, - "r_y3": 435.41, + "r_x0": 284.0, + "r_y0": 545.0, + "r_x1": 284.0, + "r_y1": 442.33, + "r_x2": 268.0, + "r_y2": 442.33, + "r_x3": 268.0, + "r_y3": 545.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 93.0, + "from_ocr": true }, { "index": 9, @@ -294,21 +294,21 @@ "a": 255 }, "rect": { - "r_x0": 242.7, - "r_y0": 355.1, - "r_x1": 256.41, - "r_y1": 355.1, - "r_x2": 256.41, - "r_y2": 323.39, - "r_x3": 242.7, - "r_y3": 323.39, + "r_x0": 315.33, + "r_y0": 515.0, + "r_x1": 315.33, + "r_y1": 468.0, + "r_x2": 299.67, + "r_y2": 468.0, + "r_x3": 299.67, + "r_y3": 515.0, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 10, @@ -319,21 +319,21 @@ "a": 255 }, "rect": { - "r_x0": 315.82, - "r_y0": 725.23, - "r_x1": 329.54, - "r_y1": 725.23, - "r_x2": 329.54, - "r_y2": 634.24, - "r_x3": 315.82, - "r_y3": 634.24, + "r_x0": 121.67, + "r_y0": 385.67, + "r_x1": 121.67, + "r_y1": 274.0, + "r_x2": 105.67, + "r_y2": 274.0, + "r_x3": 105.67, + "r_y3": 385.67, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 11, @@ -344,21 +344,21 @@ "a": 255 }, "rect": { - "r_x0": 315.82, - "r_y0": 590.23, - "r_x1": 329.54, - "r_y1": 590.23, - "r_x2": 329.54, - "r_y2": 542.27, - "r_x3": 315.82, - "r_y3": 542.27, + "r_x0": 153.0, + "r_y0": 363.0, + "r_x1": 153.0, + "r_y1": 292.67, + "r_x2": 137.0, + "r_y2": 292.67, + "r_x3": 137.0, + "r_y3": 363.0, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 12, @@ -369,21 +369,96 @@ "a": 255 }, "rect": { - "r_x0": 315.82, - "r_y0": 357.35, - "r_x1": 329.54, - "r_y1": 357.35, - "r_x2": 329.54, - "r_y2": 319.15, - "r_x3": 315.82, - "r_y3": 319.15, + "r_x0": 204.33, + "r_y0": 384.0, + "r_x1": 204.33, + "r_y1": 278.0, + "r_x2": 188.33, + "r_y2": 278.0, + "r_x3": 188.33, + "r_y3": 384.0, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 236.0, + "r_y0": 351.33, + "r_x1": 236.0, + "r_y1": 304.33, + "r_x2": 220.0, + "r_y2": 304.33, + "r_x3": 220.0, + "r_y3": 351.33, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 284.0, + "r_y0": 383.67, + "r_x1": 284.0, + "r_y1": 278.0, + "r_x2": 268.0, + "r_y2": 278.0, + "r_x3": 268.0, + "r_y3": 383.67, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 315.33, + "r_y0": 351.33, + "r_x1": 315.33, + "r_y1": 304.33, + "r_x2": 299.67, + "r_y2": 304.33, + "r_x3": 299.67, + "r_y3": 351.33, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "has_chars": false, @@ -399,13 +474,13 @@ "id": 0, "label": "table", "bbox": { - "l": 75.13, - "t": 279.86, - "r": 361.19, - "b": 739.0, + "l": 87.65, + "t": 240.9, + "r": 334.58, + "b": 722.96, "coord_origin": "TOPLEFT" }, - "confidence": 0.947, + "confidence": 0.979, "cells": [ { "index": 0, @@ -416,21 +491,21 @@ "a": 255 }, "rect": { - "r_x0": 106.57, - "r_y0": 596.98, - "r_x1": 120.29, - "r_y1": 596.98, - "r_x2": 120.29, - "r_y2": 534.41, - "r_x3": 106.57, - "r_y3": 534.41, + "r_x0": 126.33, + "r_y0": 694.67, + "r_x1": 126.33, + "r_y1": 602.0, + "r_x2": 105.67, + "r_y2": 602.0, + "r_x3": 105.67, + "r_y3": 694.67, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true }, { "index": 1, @@ -441,21 +516,21 @@ "a": 255 }, "rect": { - "r_x0": 106.57, - "r_y0": 483.35, - "r_x1": 120.29, - "r_y1": 483.35, - "r_x2": 120.29, - "r_y2": 420.78, - "r_x3": 106.57, - "r_y3": 420.78, + "r_x0": 157.67, + "r_y0": 680.33, + "r_x1": 157.67, + "r_y1": 610.0, + "r_x2": 137.0, + "r_y2": 610.0, + "r_x3": 137.0, + "r_y3": 680.33, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 2, @@ -466,21 +541,21 @@ "a": 255 }, "rect": { - "r_x0": 106.57, - "r_y0": 369.73, - "r_x1": 120.29, - "r_y1": 369.73, - "r_x2": 120.29, - "r_y2": 307.16, - "r_x3": 106.57, - "r_y3": 307.16, + "r_x0": 220.0, + "r_y0": 670.33, + "r_x1": 220.0, + "r_y1": 623.33, + "r_x2": 204.0, + "r_y2": 623.33, + "r_x3": 204.0, + "r_y3": 670.33, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 3, @@ -491,21 +566,21 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 718.48, - "r_x1": 187.79, - "r_y1": 718.48, - "r_x2": 187.79, - "r_y2": 641.33, - "r_x3": 174.07, - "r_y3": 641.33, + "r_x0": 300.0, + "r_y0": 670.33, + "r_x1": 300.0, + "r_y1": 623.33, + "r_x2": 284.0, + "r_y2": 623.33, + "r_x3": 284.0, + "r_y3": 670.33, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 4, @@ -516,21 +591,21 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 600.35, - "r_x1": 187.79, - "r_y1": 600.35, - "r_x2": 187.79, - "r_y2": 531.29, - "r_x3": 174.07, - "r_y3": 531.29, + "r_x0": 126.33, + "r_y0": 559.67, + "r_x1": 126.33, + "r_y1": 428.0, + "r_x2": 105.67, + "r_y2": 428.0, + "r_x3": 105.67, + "r_y3": 559.67, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 91.0, + "from_ocr": true }, { "index": 5, @@ -541,21 +616,21 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 494.6, - "r_x1": 187.79, - "r_y1": 494.6, - "r_x2": 187.79, - "r_y2": 410.9, - "r_x3": 174.07, - "r_y3": 410.9, + "r_x0": 153.0, + "r_y0": 526.67, + "r_x1": 153.0, + "r_y1": 456.0, + "r_x2": 137.0, + "r_y2": 456.0, + "r_x3": 137.0, + "r_y3": 526.67, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 6, @@ -566,21 +641,21 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 350.6, - "r_x1": 187.79, - "r_y1": 350.6, - "r_x2": 187.79, - "r_y2": 326.21, - "r_x3": 174.07, - "r_y3": 326.21, + "r_x0": 204.33, + "r_y0": 545.0, + "r_x1": 204.33, + "r_y1": 442.33, + "r_x2": 188.33, + "r_y2": 442.33, + "r_x3": 188.33, + "r_y3": 545.0, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 7, @@ -591,21 +666,21 @@ "a": 255 }, "rect": { - "r_x0": 242.7, - "r_y0": 711.73, - "r_x1": 256.41, - "r_y1": 711.73, - "r_x2": 256.41, - "r_y2": 647.54, - "r_x3": 242.7, - "r_y3": 647.54, + "r_x0": 236.0, + "r_y0": 515.0, + "r_x1": 236.0, + "r_y1": 468.0, + "r_x2": 220.0, + "r_y2": 468.0, + "r_x3": 220.0, + "r_y3": 515.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 8, @@ -616,21 +691,21 @@ "a": 255 }, "rect": { - "r_x0": 242.7, - "r_y0": 468.73, - "r_x1": 256.41, - "r_y1": 468.73, - "r_x2": 256.41, - "r_y2": 435.41, - "r_x3": 242.7, - "r_y3": 435.41, + "r_x0": 284.0, + "r_y0": 545.0, + "r_x1": 284.0, + "r_y1": 442.33, + "r_x2": 268.0, + "r_y2": 442.33, + "r_x3": 268.0, + "r_y3": 545.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 93.0, + "from_ocr": true }, { "index": 9, @@ -641,21 +716,21 @@ "a": 255 }, "rect": { - "r_x0": 242.7, - "r_y0": 355.1, - "r_x1": 256.41, - "r_y1": 355.1, - "r_x2": 256.41, - "r_y2": 323.39, - "r_x3": 242.7, - "r_y3": 323.39, + "r_x0": 315.33, + "r_y0": 515.0, + "r_x1": 315.33, + "r_y1": 468.0, + "r_x2": 299.67, + "r_y2": 468.0, + "r_x3": 299.67, + "r_y3": 515.0, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 10, @@ -666,21 +741,21 @@ "a": 255 }, "rect": { - "r_x0": 315.82, - "r_y0": 725.23, - "r_x1": 329.54, - "r_y1": 725.23, - "r_x2": 329.54, - "r_y2": 634.24, - "r_x3": 315.82, - "r_y3": 634.24, + "r_x0": 121.67, + "r_y0": 385.67, + "r_x1": 121.67, + "r_y1": 274.0, + "r_x2": 105.67, + "r_y2": 274.0, + "r_x3": 105.67, + "r_y3": 385.67, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 11, @@ -691,21 +766,21 @@ "a": 255 }, "rect": { - "r_x0": 315.82, - "r_y0": 590.23, - "r_x1": 329.54, - "r_y1": 590.23, - "r_x2": 329.54, - "r_y2": 542.27, - "r_x3": 315.82, - "r_y3": 542.27, + "r_x0": 153.0, + "r_y0": 363.0, + "r_x1": 153.0, + "r_y1": 292.67, + "r_x2": 137.0, + "r_y2": 292.67, + "r_x3": 137.0, + "r_y3": 363.0, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 12, @@ -716,35 +791,110 @@ "a": 255 }, "rect": { - "r_x0": 315.82, - "r_y0": 357.35, - "r_x1": 329.54, - "r_y1": 357.35, - "r_x2": 329.54, - "r_y2": 319.15, - "r_x3": 315.82, - "r_y3": 319.15, + "r_x0": 204.33, + "r_y0": 384.0, + "r_x1": 204.33, + "r_y1": 278.0, + "r_x2": 188.33, + "r_y2": 278.0, + "r_x3": 188.33, + "r_y3": 384.0, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 236.0, + "r_y0": 351.33, + "r_x1": 236.0, + "r_y1": 304.33, + "r_x2": 220.0, + "r_y2": 304.33, + "r_x3": 220.0, + "r_y3": 351.33, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 284.0, + "r_y0": 383.67, + "r_x1": 284.0, + "r_y1": 278.0, + "r_x2": 268.0, + "r_y2": 278.0, + "r_x3": 268.0, + "r_y3": 383.67, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 315.33, + "r_y0": 351.33, + "r_x1": 315.33, + "r_y1": 304.33, + "r_x2": 299.67, + "r_y2": 304.33, + "r_x3": 299.67, + "r_y3": 351.33, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "children": [ { - "id": 11, + "id": 1, "label": "text", "bbox": { - "l": 106.57, - "t": 534.41, - "r": 120.29, - "b": 596.98, + "l": 105.67, + "t": 602.0, + "r": 126.33, + "b": 694.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 90.0, "cells": [ { "index": 0, @@ -755,36 +905,36 @@ "a": 255 }, "rect": { - "r_x0": 106.57, - "r_y0": 596.98, - "r_x1": 120.29, - "r_y1": 596.98, - "r_x2": 120.29, - "r_y2": 534.41, - "r_x3": 106.57, - "r_y3": 534.41, + "r_x0": 126.33, + "r_y0": 694.67, + "r_x1": 126.33, + "r_y1": 602.0, + "r_x2": 105.67, + "r_y2": 602.0, + "r_x3": 105.67, + "r_y3": 694.67, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true } ], "children": [] }, { - "id": 12, + "id": 2, "label": "text", "bbox": { - "l": 106.57, - "t": 420.78, - "r": 120.29, - "b": 483.35, + "l": 137.0, + "t": 610.0, + "r": 157.67, + "b": 680.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 92.0, "cells": [ { "index": 1, @@ -795,36 +945,36 @@ "a": 255 }, "rect": { - "r_x0": 106.57, - "r_y0": 483.35, - "r_x1": 120.29, - "r_y1": 483.35, - "r_x2": 120.29, - "r_y2": 420.78, - "r_x3": 106.57, - "r_y3": 420.78, + "r_x0": 157.67, + "r_y0": 680.33, + "r_x1": 157.67, + "r_y1": 610.0, + "r_x2": 137.0, + "r_y2": 610.0, + "r_x3": 137.0, + "r_y3": 680.33, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true } ], "children": [] }, { - "id": 13, + "id": 3, "label": "text", "bbox": { - "l": 106.57, - "t": 307.16, - "r": 120.29, - "b": 369.73, + "l": 204.0, + "t": 623.33, + "r": 220.0, + "b": 670.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 2, @@ -835,36 +985,36 @@ "a": 255 }, "rect": { - "r_x0": 106.57, - "r_y0": 369.73, - "r_x1": 120.29, - "r_y1": 369.73, - "r_x2": 120.29, - "r_y2": 307.16, - "r_x3": 106.57, - "r_y3": 307.16, + "r_x0": 220.0, + "r_y0": 670.33, + "r_x1": 220.0, + "r_y1": 623.33, + "r_x2": 204.0, + "r_y2": 623.33, + "r_x3": 204.0, + "r_y3": 670.33, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 14, + "id": 4, "label": "text", "bbox": { - "l": 174.07, - "t": 641.33, - "r": 187.79, - "b": 718.48, + "l": 284.0, + "t": 623.33, + "r": 300.0, + "b": 670.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 3, @@ -875,36 +1025,36 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 718.48, - "r_x1": 187.79, - "r_y1": 718.48, - "r_x2": 187.79, - "r_y2": 641.33, - "r_x3": 174.07, - "r_y3": 641.33, + "r_x0": 300.0, + "r_y0": 670.33, + "r_x1": 300.0, + "r_y1": 623.33, + "r_x2": 284.0, + "r_y2": 623.33, + "r_x3": 284.0, + "r_y3": 670.33, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 15, + "id": 5, "label": "text", "bbox": { - "l": 174.07, - "t": 531.29, - "r": 187.79, - "b": 600.35, + "l": 105.67, + "t": 428.0, + "r": 126.33, + "b": 559.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 91.0, "cells": [ { "index": 4, @@ -915,36 +1065,36 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 600.35, - "r_x1": 187.79, - "r_y1": 600.35, - "r_x2": 187.79, - "r_y2": 531.29, - "r_x3": 174.07, - "r_y3": 531.29, + "r_x0": 126.33, + "r_y0": 559.67, + "r_x1": 126.33, + "r_y1": 428.0, + "r_x2": 105.67, + "r_y2": 428.0, + "r_x3": 105.67, + "r_y3": 559.67, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 91.0, + "from_ocr": true } ], "children": [] }, { - "id": 16, + "id": 6, "label": "text", "bbox": { - "l": 174.07, - "t": 410.9, - "r": 187.79, - "b": 494.6, + "l": 137.0, + "t": 456.0, + "r": 153.0, + "b": 526.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 5, @@ -955,36 +1105,36 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 494.6, - "r_x1": 187.79, - "r_y1": 494.6, - "r_x2": 187.79, - "r_y2": 410.9, - "r_x3": 174.07, - "r_y3": 410.9, + "r_x0": 153.0, + "r_y0": 526.67, + "r_x1": 153.0, + "r_y1": 456.0, + "r_x2": 137.0, + "r_y2": 456.0, + "r_x3": 137.0, + "r_y3": 526.67, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true } ], "children": [] }, { - "id": 17, + "id": 7, "label": "text", "bbox": { - "l": 174.07, - "t": 326.21, - "r": 187.79, - "b": 350.6, + "l": 188.33, + "t": 442.33, + "r": 204.33, + "b": 545.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 6, @@ -995,36 +1145,36 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 350.6, - "r_x1": 187.79, - "r_y1": 350.6, - "r_x2": 187.79, - "r_y2": 326.21, - "r_x3": 174.07, - "r_y3": 326.21, + "r_x0": 204.33, + "r_y0": 545.0, + "r_x1": 204.33, + "r_y1": 442.33, + "r_x2": 188.33, + "r_y2": 442.33, + "r_x3": 188.33, + "r_y3": 545.0, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true } ], "children": [] }, { - "id": 18, + "id": 8, "label": "text", "bbox": { - "l": 242.7, - "t": 647.54, - "r": 256.41, - "b": 711.73, + "l": 220.0, + "t": 468.0, + "r": 236.0, + "b": 515.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 7, @@ -1035,36 +1185,36 @@ "a": 255 }, "rect": { - "r_x0": 242.7, - "r_y0": 711.73, - "r_x1": 256.41, - "r_y1": 711.73, - "r_x2": 256.41, - "r_y2": 647.54, - "r_x3": 242.7, - "r_y3": 647.54, + "r_x0": 236.0, + "r_y0": 515.0, + "r_x1": 236.0, + "r_y1": 468.0, + "r_x2": 220.0, + "r_y2": 468.0, + "r_x3": 220.0, + "r_y3": 515.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 19, + "id": 9, "label": "text", "bbox": { - "l": 242.7, - "t": 435.41, - "r": 256.41, - "b": 468.73, + "l": 268.0, + "t": 442.33, + "r": 284.0, + "b": 545.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 93.0, "cells": [ { "index": 8, @@ -1075,36 +1225,36 @@ "a": 255 }, "rect": { - "r_x0": 242.7, - "r_y0": 468.73, - "r_x1": 256.41, - "r_y1": 468.73, - "r_x2": 256.41, - "r_y2": 435.41, - "r_x3": 242.7, - "r_y3": 435.41, + "r_x0": 284.0, + "r_y0": 545.0, + "r_x1": 284.0, + "r_y1": 442.33, + "r_x2": 268.0, + "r_y2": 442.33, + "r_x3": 268.0, + "r_y3": 545.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 93.0, + "from_ocr": true } ], "children": [] }, { - "id": 20, + "id": 10, "label": "text", "bbox": { - "l": 242.7, - "t": 323.39, - "r": 256.41, - "b": 355.1, + "l": 299.67, + "t": 468.0, + "r": 315.33, + "b": 515.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 9, @@ -1115,36 +1265,36 @@ "a": 255 }, "rect": { - "r_x0": 242.7, - "r_y0": 355.1, - "r_x1": 256.41, - "r_y1": 355.1, - "r_x2": 256.41, - "r_y2": 323.39, - "r_x3": 242.7, - "r_y3": 323.39, + "r_x0": 315.33, + "r_y0": 515.0, + "r_x1": 315.33, + "r_y1": 468.0, + "r_x2": 299.67, + "r_y2": 468.0, + "r_x3": 299.67, + "r_y3": 515.0, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 21, + "id": 11, "label": "text", "bbox": { - "l": 315.82, - "t": 634.24, - "r": 329.54, - "b": 725.23, + "l": 105.67, + "t": 274.0, + "r": 121.67, + "b": 385.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 10, @@ -1155,36 +1305,36 @@ "a": 255 }, "rect": { - "r_x0": 315.82, - "r_y0": 725.23, - "r_x1": 329.54, - "r_y1": 725.23, - "r_x2": 329.54, - "r_y2": 634.24, - "r_x3": 315.82, - "r_y3": 634.24, + "r_x0": 121.67, + "r_y0": 385.67, + "r_x1": 121.67, + "r_y1": 274.0, + "r_x2": 105.67, + "r_y2": 274.0, + "r_x3": 105.67, + "r_y3": 385.67, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true } ], "children": [] }, { - "id": 22, + "id": 12, "label": "text", "bbox": { - "l": 315.82, - "t": 542.27, - "r": 329.54, - "b": 590.23, + "l": 137.0, + "t": 292.67, + "r": 153.0, + "b": 363.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 11, @@ -1195,36 +1345,36 @@ "a": 255 }, "rect": { - "r_x0": 315.82, - "r_y0": 590.23, - "r_x1": 329.54, - "r_y1": 590.23, - "r_x2": 329.54, - "r_y2": 542.27, - "r_x3": 315.82, - "r_y3": 542.27, + "r_x0": 153.0, + "r_y0": 363.0, + "r_x1": 153.0, + "r_y1": 292.67, + "r_x2": 137.0, + "r_y2": 292.67, + "r_x3": 137.0, + "r_y3": 363.0, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 23, + "id": 13, "label": "text", "bbox": { - "l": 315.82, - "t": 319.15, - "r": 329.54, - "b": 357.35, + "l": 188.33, + "t": 278.0, + "r": 204.33, + "b": 384.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 12, @@ -1235,21 +1385,141 @@ "a": 255 }, "rect": { - "r_x0": 315.82, - "r_y0": 357.35, - "r_x1": 329.54, - "r_y1": 357.35, - "r_x2": 329.54, - "r_y2": 319.15, - "r_x3": 315.82, - "r_y3": 319.15, + "r_x0": 204.33, + "r_y0": 384.0, + "r_x1": 204.33, + "r_y1": 278.0, + "r_x2": 188.33, + "r_y2": 278.0, + "r_x3": 188.33, + "r_y3": 384.0, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 14, + "label": "text", + "bbox": { + "l": 220.0, + "t": 304.33, + "r": 236.0, + "b": 351.33, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 236.0, + "r_y0": 351.33, + "r_x1": 236.0, + "r_y1": 304.33, + "r_x2": 220.0, + "r_y2": 304.33, + "r_x3": 220.0, + "r_y3": 351.33, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 15, + "label": "text", + "bbox": { + "l": 268.0, + "t": 278.0, + "r": 284.0, + "b": 383.67, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 284.0, + "r_y0": 383.67, + "r_x1": 284.0, + "r_y1": 278.0, + "r_x2": 268.0, + "r_y2": 278.0, + "r_x3": 268.0, + "r_y3": 383.67, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 16, + "label": "text", + "bbox": { + "l": 299.67, + "t": 304.33, + "r": 315.33, + "b": 351.33, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 315.33, + "r_y0": 351.33, + "r_x1": 315.33, + "r_y1": 304.33, + "r_x2": 299.67, + "r_y2": 304.33, + "r_x3": 299.67, + "r_y3": 351.33, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "children": [] @@ -1268,13 +1538,13 @@ "id": 0, "label": "table", "bbox": { - "l": 75.13, - "t": 279.86, - "r": 361.19, - "b": 739.0, + "l": 87.65, + "t": 240.9, + "r": 334.58, + "b": 722.96, "coord_origin": "TOPLEFT" }, - "confidence": 0.947, + "confidence": 0.979, "cells": [ { "index": 0, @@ -1285,21 +1555,21 @@ "a": 255 }, "rect": { - "r_x0": 106.57, - "r_y0": 596.98, - "r_x1": 120.29, - "r_y1": 596.98, - "r_x2": 120.29, - "r_y2": 534.41, - "r_x3": 106.57, - "r_y3": 534.41, + "r_x0": 126.33, + "r_y0": 694.67, + "r_x1": 126.33, + "r_y1": 602.0, + "r_x2": 105.67, + "r_y2": 602.0, + "r_x3": 105.67, + "r_y3": 694.67, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true }, { "index": 1, @@ -1310,21 +1580,21 @@ "a": 255 }, "rect": { - "r_x0": 106.57, - "r_y0": 483.35, - "r_x1": 120.29, - "r_y1": 483.35, - "r_x2": 120.29, - "r_y2": 420.78, - "r_x3": 106.57, - "r_y3": 420.78, + "r_x0": 157.67, + "r_y0": 680.33, + "r_x1": 157.67, + "r_y1": 610.0, + "r_x2": 137.0, + "r_y2": 610.0, + "r_x3": 137.0, + "r_y3": 680.33, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 2, @@ -1335,21 +1605,21 @@ "a": 255 }, "rect": { - "r_x0": 106.57, - "r_y0": 369.73, - "r_x1": 120.29, - "r_y1": 369.73, - "r_x2": 120.29, - "r_y2": 307.16, - "r_x3": 106.57, - "r_y3": 307.16, + "r_x0": 220.0, + "r_y0": 670.33, + "r_x1": 220.0, + "r_y1": 623.33, + "r_x2": 204.0, + "r_y2": 623.33, + "r_x3": 204.0, + "r_y3": 670.33, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 3, @@ -1360,21 +1630,21 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 718.48, - "r_x1": 187.79, - "r_y1": 718.48, - "r_x2": 187.79, - "r_y2": 641.33, - "r_x3": 174.07, - "r_y3": 641.33, + "r_x0": 300.0, + "r_y0": 670.33, + "r_x1": 300.0, + "r_y1": 623.33, + "r_x2": 284.0, + "r_y2": 623.33, + "r_x3": 284.0, + "r_y3": 670.33, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 4, @@ -1385,21 +1655,21 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 600.35, - "r_x1": 187.79, - "r_y1": 600.35, - "r_x2": 187.79, - "r_y2": 531.29, - "r_x3": 174.07, - "r_y3": 531.29, + "r_x0": 126.33, + "r_y0": 559.67, + "r_x1": 126.33, + "r_y1": 428.0, + "r_x2": 105.67, + "r_y2": 428.0, + "r_x3": 105.67, + "r_y3": 559.67, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 91.0, + "from_ocr": true }, { "index": 5, @@ -1410,21 +1680,21 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 494.6, - "r_x1": 187.79, - "r_y1": 494.6, - "r_x2": 187.79, - "r_y2": 410.9, - "r_x3": 174.07, - "r_y3": 410.9, + "r_x0": 153.0, + "r_y0": 526.67, + "r_x1": 153.0, + "r_y1": 456.0, + "r_x2": 137.0, + "r_y2": 456.0, + "r_x3": 137.0, + "r_y3": 526.67, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 6, @@ -1435,21 +1705,21 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 350.6, - "r_x1": 187.79, - "r_y1": 350.6, - "r_x2": 187.79, - "r_y2": 326.21, - "r_x3": 174.07, - "r_y3": 326.21, + "r_x0": 204.33, + "r_y0": 545.0, + "r_x1": 204.33, + "r_y1": 442.33, + "r_x2": 188.33, + "r_y2": 442.33, + "r_x3": 188.33, + "r_y3": 545.0, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 7, @@ -1460,21 +1730,21 @@ "a": 255 }, "rect": { - "r_x0": 242.7, - "r_y0": 711.73, - "r_x1": 256.41, - "r_y1": 711.73, - "r_x2": 256.41, - "r_y2": 647.54, - "r_x3": 242.7, - "r_y3": 647.54, + "r_x0": 236.0, + "r_y0": 515.0, + "r_x1": 236.0, + "r_y1": 468.0, + "r_x2": 220.0, + "r_y2": 468.0, + "r_x3": 220.0, + "r_y3": 515.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 8, @@ -1485,21 +1755,21 @@ "a": 255 }, "rect": { - "r_x0": 242.7, - "r_y0": 468.73, - "r_x1": 256.41, - "r_y1": 468.73, - "r_x2": 256.41, - "r_y2": 435.41, - "r_x3": 242.7, - "r_y3": 435.41, + "r_x0": 284.0, + "r_y0": 545.0, + "r_x1": 284.0, + "r_y1": 442.33, + "r_x2": 268.0, + "r_y2": 442.33, + "r_x3": 268.0, + "r_y3": 545.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 93.0, + "from_ocr": true }, { "index": 9, @@ -1510,21 +1780,21 @@ "a": 255 }, "rect": { - "r_x0": 242.7, - "r_y0": 355.1, - "r_x1": 256.41, - "r_y1": 355.1, - "r_x2": 256.41, - "r_y2": 323.39, - "r_x3": 242.7, - "r_y3": 323.39, + "r_x0": 315.33, + "r_y0": 515.0, + "r_x1": 315.33, + "r_y1": 468.0, + "r_x2": 299.67, + "r_y2": 468.0, + "r_x3": 299.67, + "r_y3": 515.0, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 10, @@ -1535,21 +1805,21 @@ "a": 255 }, "rect": { - "r_x0": 315.82, - "r_y0": 725.23, - "r_x1": 329.54, - "r_y1": 725.23, - "r_x2": 329.54, - "r_y2": 634.24, - "r_x3": 315.82, - "r_y3": 634.24, + "r_x0": 121.67, + "r_y0": 385.67, + "r_x1": 121.67, + "r_y1": 274.0, + "r_x2": 105.67, + "r_y2": 274.0, + "r_x3": 105.67, + "r_y3": 385.67, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 11, @@ -1560,21 +1830,21 @@ "a": 255 }, "rect": { - "r_x0": 315.82, - "r_y0": 590.23, - "r_x1": 329.54, - "r_y1": 590.23, - "r_x2": 329.54, - "r_y2": 542.27, - "r_x3": 315.82, - "r_y3": 542.27, + "r_x0": 153.0, + "r_y0": 363.0, + "r_x1": 153.0, + "r_y1": 292.67, + "r_x2": 137.0, + "r_y2": 292.67, + "r_x3": 137.0, + "r_y3": 363.0, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 12, @@ -1585,35 +1855,110 @@ "a": 255 }, "rect": { - "r_x0": 315.82, - "r_y0": 357.35, - "r_x1": 329.54, - "r_y1": 357.35, - "r_x2": 329.54, - "r_y2": 319.15, - "r_x3": 315.82, - "r_y3": 319.15, + "r_x0": 204.33, + "r_y0": 384.0, + "r_x1": 204.33, + "r_y1": 278.0, + "r_x2": 188.33, + "r_y2": 278.0, + "r_x3": 188.33, + "r_y3": 384.0, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 236.0, + "r_y0": 351.33, + "r_x1": 236.0, + "r_y1": 304.33, + "r_x2": 220.0, + "r_y2": 304.33, + "r_x3": 220.0, + "r_y3": 351.33, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 284.0, + "r_y0": 383.67, + "r_x1": 284.0, + "r_y1": 278.0, + "r_x2": 268.0, + "r_y2": 278.0, + "r_x3": 268.0, + "r_y3": 383.67, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 315.33, + "r_y0": 351.33, + "r_x1": 315.33, + "r_y1": 304.33, + "r_x2": 299.67, + "r_y2": 304.33, + "r_x3": 299.67, + "r_y3": 351.33, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "children": [ { - "id": 11, + "id": 1, "label": "text", "bbox": { - "l": 106.57, - "t": 534.41, - "r": 120.29, - "b": 596.98, + "l": 105.67, + "t": 602.0, + "r": 126.33, + "b": 694.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 90.0, "cells": [ { "index": 0, @@ -1624,36 +1969,36 @@ "a": 255 }, "rect": { - "r_x0": 106.57, - "r_y0": 596.98, - "r_x1": 120.29, - "r_y1": 596.98, - "r_x2": 120.29, - "r_y2": 534.41, - "r_x3": 106.57, - "r_y3": 534.41, + "r_x0": 126.33, + "r_y0": 694.67, + "r_x1": 126.33, + "r_y1": 602.0, + "r_x2": 105.67, + "r_y2": 602.0, + "r_x3": 105.67, + "r_y3": 694.67, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true } ], "children": [] }, { - "id": 12, + "id": 2, "label": "text", "bbox": { - "l": 106.57, - "t": 420.78, - "r": 120.29, - "b": 483.35, + "l": 137.0, + "t": 610.0, + "r": 157.67, + "b": 680.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 92.0, "cells": [ { "index": 1, @@ -1664,36 +2009,36 @@ "a": 255 }, "rect": { - "r_x0": 106.57, - "r_y0": 483.35, - "r_x1": 120.29, - "r_y1": 483.35, - "r_x2": 120.29, - "r_y2": 420.78, - "r_x3": 106.57, - "r_y3": 420.78, + "r_x0": 157.67, + "r_y0": 680.33, + "r_x1": 157.67, + "r_y1": 610.0, + "r_x2": 137.0, + "r_y2": 610.0, + "r_x3": 137.0, + "r_y3": 680.33, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true } ], "children": [] }, { - "id": 13, + "id": 3, "label": "text", "bbox": { - "l": 106.57, - "t": 307.16, - "r": 120.29, - "b": 369.73, + "l": 204.0, + "t": 623.33, + "r": 220.0, + "b": 670.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 2, @@ -1704,36 +2049,36 @@ "a": 255 }, "rect": { - "r_x0": 106.57, - "r_y0": 369.73, - "r_x1": 120.29, - "r_y1": 369.73, - "r_x2": 120.29, - "r_y2": 307.16, - "r_x3": 106.57, - "r_y3": 307.16, + "r_x0": 220.0, + "r_y0": 670.33, + "r_x1": 220.0, + "r_y1": 623.33, + "r_x2": 204.0, + "r_y2": 623.33, + "r_x3": 204.0, + "r_y3": 670.33, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 14, + "id": 4, "label": "text", "bbox": { - "l": 174.07, - "t": 641.33, - "r": 187.79, - "b": 718.48, + "l": 284.0, + "t": 623.33, + "r": 300.0, + "b": 670.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 3, @@ -1744,36 +2089,36 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 718.48, - "r_x1": 187.79, - "r_y1": 718.48, - "r_x2": 187.79, - "r_y2": 641.33, - "r_x3": 174.07, - "r_y3": 641.33, + "r_x0": 300.0, + "r_y0": 670.33, + "r_x1": 300.0, + "r_y1": 623.33, + "r_x2": 284.0, + "r_y2": 623.33, + "r_x3": 284.0, + "r_y3": 670.33, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 15, + "id": 5, "label": "text", "bbox": { - "l": 174.07, - "t": 531.29, - "r": 187.79, - "b": 600.35, + "l": 105.67, + "t": 428.0, + "r": 126.33, + "b": 559.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 91.0, "cells": [ { "index": 4, @@ -1784,36 +2129,36 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 600.35, - "r_x1": 187.79, - "r_y1": 600.35, - "r_x2": 187.79, - "r_y2": 531.29, - "r_x3": 174.07, - "r_y3": 531.29, + "r_x0": 126.33, + "r_y0": 559.67, + "r_x1": 126.33, + "r_y1": 428.0, + "r_x2": 105.67, + "r_y2": 428.0, + "r_x3": 105.67, + "r_y3": 559.67, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 91.0, + "from_ocr": true } ], "children": [] }, { - "id": 16, + "id": 6, "label": "text", "bbox": { - "l": 174.07, - "t": 410.9, - "r": 187.79, - "b": 494.6, + "l": 137.0, + "t": 456.0, + "r": 153.0, + "b": 526.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 5, @@ -1824,36 +2169,36 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 494.6, - "r_x1": 187.79, - "r_y1": 494.6, - "r_x2": 187.79, - "r_y2": 410.9, - "r_x3": 174.07, - "r_y3": 410.9, + "r_x0": 153.0, + "r_y0": 526.67, + "r_x1": 153.0, + "r_y1": 456.0, + "r_x2": 137.0, + "r_y2": 456.0, + "r_x3": 137.0, + "r_y3": 526.67, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true } ], "children": [] }, { - "id": 17, + "id": 7, "label": "text", "bbox": { - "l": 174.07, - "t": 326.21, - "r": 187.79, - "b": 350.6, + "l": 188.33, + "t": 442.33, + "r": 204.33, + "b": 545.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 6, @@ -1864,36 +2209,36 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 350.6, - "r_x1": 187.79, - "r_y1": 350.6, - "r_x2": 187.79, - "r_y2": 326.21, - "r_x3": 174.07, - "r_y3": 326.21, + "r_x0": 204.33, + "r_y0": 545.0, + "r_x1": 204.33, + "r_y1": 442.33, + "r_x2": 188.33, + "r_y2": 442.33, + "r_x3": 188.33, + "r_y3": 545.0, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true } ], "children": [] }, { - "id": 18, + "id": 8, "label": "text", "bbox": { - "l": 242.7, - "t": 647.54, - "r": 256.41, - "b": 711.73, + "l": 220.0, + "t": 468.0, + "r": 236.0, + "b": 515.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 7, @@ -1904,36 +2249,36 @@ "a": 255 }, "rect": { - "r_x0": 242.7, - "r_y0": 711.73, - "r_x1": 256.41, - "r_y1": 711.73, - "r_x2": 256.41, - "r_y2": 647.54, - "r_x3": 242.7, - "r_y3": 647.54, + "r_x0": 236.0, + "r_y0": 515.0, + "r_x1": 236.0, + "r_y1": 468.0, + "r_x2": 220.0, + "r_y2": 468.0, + "r_x3": 220.0, + "r_y3": 515.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 19, + "id": 9, "label": "text", "bbox": { - "l": 242.7, - "t": 435.41, - "r": 256.41, - "b": 468.73, + "l": 268.0, + "t": 442.33, + "r": 284.0, + "b": 545.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 93.0, "cells": [ { "index": 8, @@ -1944,36 +2289,36 @@ "a": 255 }, "rect": { - "r_x0": 242.7, - "r_y0": 468.73, - "r_x1": 256.41, - "r_y1": 468.73, - "r_x2": 256.41, - "r_y2": 435.41, - "r_x3": 242.7, - "r_y3": 435.41, + "r_x0": 284.0, + "r_y0": 545.0, + "r_x1": 284.0, + "r_y1": 442.33, + "r_x2": 268.0, + "r_y2": 442.33, + "r_x3": 268.0, + "r_y3": 545.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 93.0, + "from_ocr": true } ], "children": [] }, { - "id": 20, + "id": 10, "label": "text", "bbox": { - "l": 242.7, - "t": 323.39, - "r": 256.41, - "b": 355.1, + "l": 299.67, + "t": 468.0, + "r": 315.33, + "b": 515.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 9, @@ -1984,36 +2329,36 @@ "a": 255 }, "rect": { - "r_x0": 242.7, - "r_y0": 355.1, - "r_x1": 256.41, - "r_y1": 355.1, - "r_x2": 256.41, - "r_y2": 323.39, - "r_x3": 242.7, - "r_y3": 323.39, + "r_x0": 315.33, + "r_y0": 515.0, + "r_x1": 315.33, + "r_y1": 468.0, + "r_x2": 299.67, + "r_y2": 468.0, + "r_x3": 299.67, + "r_y3": 515.0, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 21, + "id": 11, "label": "text", "bbox": { - "l": 315.82, - "t": 634.24, - "r": 329.54, - "b": 725.23, + "l": 105.67, + "t": 274.0, + "r": 121.67, + "b": 385.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 10, @@ -2024,36 +2369,36 @@ "a": 255 }, "rect": { - "r_x0": 315.82, - "r_y0": 725.23, - "r_x1": 329.54, - "r_y1": 725.23, - "r_x2": 329.54, - "r_y2": 634.24, - "r_x3": 315.82, - "r_y3": 634.24, + "r_x0": 121.67, + "r_y0": 385.67, + "r_x1": 121.67, + "r_y1": 274.0, + "r_x2": 105.67, + "r_y2": 274.0, + "r_x3": 105.67, + "r_y3": 385.67, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true } ], "children": [] }, { - "id": 22, + "id": 12, "label": "text", "bbox": { - "l": 315.82, - "t": 542.27, - "r": 329.54, - "b": 590.23, + "l": 137.0, + "t": 292.67, + "r": 153.0, + "b": 363.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 11, @@ -2064,36 +2409,36 @@ "a": 255 }, "rect": { - "r_x0": 315.82, - "r_y0": 590.23, - "r_x1": 329.54, - "r_y1": 590.23, - "r_x2": 329.54, - "r_y2": 542.27, - "r_x3": 315.82, - "r_y3": 542.27, + "r_x0": 153.0, + "r_y0": 363.0, + "r_x1": 153.0, + "r_y1": 292.67, + "r_x2": 137.0, + "r_y2": 292.67, + "r_x3": 137.0, + "r_y3": 363.0, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 23, + "id": 13, "label": "text", "bbox": { - "l": 315.82, - "t": 319.15, - "r": 329.54, - "b": 357.35, + "l": 188.33, + "t": 278.0, + "r": 204.33, + "b": 384.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 12, @@ -2104,21 +2449,141 @@ "a": 255 }, "rect": { - "r_x0": 315.82, - "r_y0": 357.35, - "r_x1": 329.54, - "r_y1": 357.35, - "r_x2": 329.54, - "r_y2": 319.15, - "r_x3": 315.82, - "r_y3": 319.15, + "r_x0": 204.33, + "r_y0": 384.0, + "r_x1": 204.33, + "r_y1": 278.0, + "r_x2": 188.33, + "r_y2": 278.0, + "r_x3": 188.33, + "r_y3": 384.0, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 14, + "label": "text", + "bbox": { + "l": 220.0, + "t": 304.33, + "r": 236.0, + "b": 351.33, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 236.0, + "r_y0": 351.33, + "r_x1": 236.0, + "r_y1": 304.33, + "r_x2": 220.0, + "r_y2": 304.33, + "r_x3": 220.0, + "r_y3": 351.33, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 15, + "label": "text", + "bbox": { + "l": 268.0, + "t": 278.0, + "r": 284.0, + "b": 383.67, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 284.0, + "r_y0": 383.67, + "r_x1": 284.0, + "r_y1": 278.0, + "r_x2": 268.0, + "r_y2": 278.0, + "r_x3": 268.0, + "r_y3": 383.67, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 16, + "label": "text", + "bbox": { + "l": 299.67, + "t": 304.33, + "r": 315.33, + "b": 351.33, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 315.33, + "r_y0": 351.33, + "r_x1": 315.33, + "r_y1": 304.33, + "r_x2": 299.67, + "r_y2": 304.33, + "r_x3": 299.67, + "r_y3": 351.33, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "children": [] @@ -2127,278 +2592,22 @@ }, "text": null, "otsl_seq": [ - "fcel", - "fcel", - "fcel", - "fcel", + "ched", + "ched", + "ched", "nl", "fcel", "fcel", "fcel", - "ecel", "nl", "fcel", "fcel", - "ecel", - "fcel", - "nl", - "ecel", - "fcel", - "fcel", "fcel", "nl" ], - "num_rows": 4, - "num_cols": 4, - "table_cells": [ - { - "bbox": { - "l": 106.57, - "t": 534.41, - "r": 120.29, - "b": 596.98, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "Column 0", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 106.57, - "t": 420.78, - "r": 120.29, - "b": 483.35, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "Column 1", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 106.57, - "t": 307.16, - "r": 120.29, - "b": 369.73, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "Column 2", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 174.07, - "t": 641.33, - "r": 187.79, - "b": 718.48, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "this is row 0", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 174.07, - "t": 531.29, - "r": 187.79, - "b": 600.35, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "some cells", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 174.07, - "t": 410.9, - "r": 187.79, - "b": 494.6, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "have content", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 174.07, - "t": 326.21, - "r": 187.79, - "b": 350.6, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "and", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 242.7, - "t": 647.54, - "r": 256.41, - "b": 711.73, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "and row 1", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 242.7, - "t": 435.41, - "r": 256.41, - "b": 468.73, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "other", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 242.7, - "t": 323.39, - "r": 256.41, - "b": 355.1, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "have", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 315.82, - "t": 634.24, - "r": 329.54, - "b": 725.23, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "and last row 2", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 315.82, - "t": 542.27, - "r": 329.54, - "b": 590.23, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "nothing", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 315.82, - "t": 319.15, - "r": 329.54, - "b": 357.35, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "inside", - "column_header": false, - "row_header": false, - "row_section": false - } - ] + "num_rows": 0, + "num_cols": 0, + "table_cells": [] } } }, @@ -2416,13 +2625,13 @@ "id": 0, "label": "table", "bbox": { - "l": 75.13, - "t": 279.86, - "r": 361.19, - "b": 739.0, + "l": 87.65, + "t": 240.9, + "r": 334.58, + "b": 722.96, "coord_origin": "TOPLEFT" }, - "confidence": 0.947, + "confidence": 0.979, "cells": [ { "index": 0, @@ -2433,21 +2642,21 @@ "a": 255 }, "rect": { - "r_x0": 106.57, - "r_y0": 596.98, - "r_x1": 120.29, - "r_y1": 596.98, - "r_x2": 120.29, - "r_y2": 534.41, - "r_x3": 106.57, - "r_y3": 534.41, + "r_x0": 126.33, + "r_y0": 694.67, + "r_x1": 126.33, + "r_y1": 602.0, + "r_x2": 105.67, + "r_y2": 602.0, + "r_x3": 105.67, + "r_y3": 694.67, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true }, { "index": 1, @@ -2458,21 +2667,21 @@ "a": 255 }, "rect": { - "r_x0": 106.57, - "r_y0": 483.35, - "r_x1": 120.29, - "r_y1": 483.35, - "r_x2": 120.29, - "r_y2": 420.78, - "r_x3": 106.57, - "r_y3": 420.78, + "r_x0": 157.67, + "r_y0": 680.33, + "r_x1": 157.67, + "r_y1": 610.0, + "r_x2": 137.0, + "r_y2": 610.0, + "r_x3": 137.0, + "r_y3": 680.33, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 2, @@ -2483,21 +2692,21 @@ "a": 255 }, "rect": { - "r_x0": 106.57, - "r_y0": 369.73, - "r_x1": 120.29, - "r_y1": 369.73, - "r_x2": 120.29, - "r_y2": 307.16, - "r_x3": 106.57, - "r_y3": 307.16, + "r_x0": 220.0, + "r_y0": 670.33, + "r_x1": 220.0, + "r_y1": 623.33, + "r_x2": 204.0, + "r_y2": 623.33, + "r_x3": 204.0, + "r_y3": 670.33, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 3, @@ -2508,21 +2717,21 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 718.48, - "r_x1": 187.79, - "r_y1": 718.48, - "r_x2": 187.79, - "r_y2": 641.33, - "r_x3": 174.07, - "r_y3": 641.33, + "r_x0": 300.0, + "r_y0": 670.33, + "r_x1": 300.0, + "r_y1": 623.33, + "r_x2": 284.0, + "r_y2": 623.33, + "r_x3": 284.0, + "r_y3": 670.33, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 4, @@ -2533,21 +2742,21 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 600.35, - "r_x1": 187.79, - "r_y1": 600.35, - "r_x2": 187.79, - "r_y2": 531.29, - "r_x3": 174.07, - "r_y3": 531.29, + "r_x0": 126.33, + "r_y0": 559.67, + "r_x1": 126.33, + "r_y1": 428.0, + "r_x2": 105.67, + "r_y2": 428.0, + "r_x3": 105.67, + "r_y3": 559.67, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 91.0, + "from_ocr": true }, { "index": 5, @@ -2558,21 +2767,21 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 494.6, - "r_x1": 187.79, - "r_y1": 494.6, - "r_x2": 187.79, - "r_y2": 410.9, - "r_x3": 174.07, - "r_y3": 410.9, + "r_x0": 153.0, + "r_y0": 526.67, + "r_x1": 153.0, + "r_y1": 456.0, + "r_x2": 137.0, + "r_y2": 456.0, + "r_x3": 137.0, + "r_y3": 526.67, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 6, @@ -2583,21 +2792,21 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 350.6, - "r_x1": 187.79, - "r_y1": 350.6, - "r_x2": 187.79, - "r_y2": 326.21, - "r_x3": 174.07, - "r_y3": 326.21, + "r_x0": 204.33, + "r_y0": 545.0, + "r_x1": 204.33, + "r_y1": 442.33, + "r_x2": 188.33, + "r_y2": 442.33, + "r_x3": 188.33, + "r_y3": 545.0, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 7, @@ -2608,21 +2817,21 @@ "a": 255 }, "rect": { - "r_x0": 242.7, - "r_y0": 711.73, - "r_x1": 256.41, - "r_y1": 711.73, - "r_x2": 256.41, - "r_y2": 647.54, - "r_x3": 242.7, - "r_y3": 647.54, + "r_x0": 236.0, + "r_y0": 515.0, + "r_x1": 236.0, + "r_y1": 468.0, + "r_x2": 220.0, + "r_y2": 468.0, + "r_x3": 220.0, + "r_y3": 515.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 8, @@ -2633,21 +2842,21 @@ "a": 255 }, "rect": { - "r_x0": 242.7, - "r_y0": 468.73, - "r_x1": 256.41, - "r_y1": 468.73, - "r_x2": 256.41, - "r_y2": 435.41, - "r_x3": 242.7, - "r_y3": 435.41, + "r_x0": 284.0, + "r_y0": 545.0, + "r_x1": 284.0, + "r_y1": 442.33, + "r_x2": 268.0, + "r_y2": 442.33, + "r_x3": 268.0, + "r_y3": 545.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 93.0, + "from_ocr": true }, { "index": 9, @@ -2658,21 +2867,21 @@ "a": 255 }, "rect": { - "r_x0": 242.7, - "r_y0": 355.1, - "r_x1": 256.41, - "r_y1": 355.1, - "r_x2": 256.41, - "r_y2": 323.39, - "r_x3": 242.7, - "r_y3": 323.39, + "r_x0": 315.33, + "r_y0": 515.0, + "r_x1": 315.33, + "r_y1": 468.0, + "r_x2": 299.67, + "r_y2": 468.0, + "r_x3": 299.67, + "r_y3": 515.0, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 10, @@ -2683,21 +2892,21 @@ "a": 255 }, "rect": { - "r_x0": 315.82, - "r_y0": 725.23, - "r_x1": 329.54, - "r_y1": 725.23, - "r_x2": 329.54, - "r_y2": 634.24, - "r_x3": 315.82, - "r_y3": 634.24, + "r_x0": 121.67, + "r_y0": 385.67, + "r_x1": 121.67, + "r_y1": 274.0, + "r_x2": 105.67, + "r_y2": 274.0, + "r_x3": 105.67, + "r_y3": 385.67, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 11, @@ -2708,21 +2917,21 @@ "a": 255 }, "rect": { - "r_x0": 315.82, - "r_y0": 590.23, - "r_x1": 329.54, - "r_y1": 590.23, - "r_x2": 329.54, - "r_y2": 542.27, - "r_x3": 315.82, - "r_y3": 542.27, + "r_x0": 153.0, + "r_y0": 363.0, + "r_x1": 153.0, + "r_y1": 292.67, + "r_x2": 137.0, + "r_y2": 292.67, + "r_x3": 137.0, + "r_y3": 363.0, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 12, @@ -2733,35 +2942,110 @@ "a": 255 }, "rect": { - "r_x0": 315.82, - "r_y0": 357.35, - "r_x1": 329.54, - "r_y1": 357.35, - "r_x2": 329.54, - "r_y2": 319.15, - "r_x3": 315.82, - "r_y3": 319.15, + "r_x0": 204.33, + "r_y0": 384.0, + "r_x1": 204.33, + "r_y1": 278.0, + "r_x2": 188.33, + "r_y2": 278.0, + "r_x3": 188.33, + "r_y3": 384.0, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 236.0, + "r_y0": 351.33, + "r_x1": 236.0, + "r_y1": 304.33, + "r_x2": 220.0, + "r_y2": 304.33, + "r_x3": 220.0, + "r_y3": 351.33, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 284.0, + "r_y0": 383.67, + "r_x1": 284.0, + "r_y1": 278.0, + "r_x2": 268.0, + "r_y2": 278.0, + "r_x3": 268.0, + "r_y3": 383.67, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 315.33, + "r_y0": 351.33, + "r_x1": 315.33, + "r_y1": 304.33, + "r_x2": 299.67, + "r_y2": 304.33, + "r_x3": 299.67, + "r_y3": 351.33, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "children": [ { - "id": 11, + "id": 1, "label": "text", "bbox": { - "l": 106.57, - "t": 534.41, - "r": 120.29, - "b": 596.98, + "l": 105.67, + "t": 602.0, + "r": 126.33, + "b": 694.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 90.0, "cells": [ { "index": 0, @@ -2772,36 +3056,36 @@ "a": 255 }, "rect": { - "r_x0": 106.57, - "r_y0": 596.98, - "r_x1": 120.29, - "r_y1": 596.98, - "r_x2": 120.29, - "r_y2": 534.41, - "r_x3": 106.57, - "r_y3": 534.41, + "r_x0": 126.33, + "r_y0": 694.67, + "r_x1": 126.33, + "r_y1": 602.0, + "r_x2": 105.67, + "r_y2": 602.0, + "r_x3": 105.67, + "r_y3": 694.67, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true } ], "children": [] }, { - "id": 12, + "id": 2, "label": "text", "bbox": { - "l": 106.57, - "t": 420.78, - "r": 120.29, - "b": 483.35, + "l": 137.0, + "t": 610.0, + "r": 157.67, + "b": 680.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 92.0, "cells": [ { "index": 1, @@ -2812,36 +3096,36 @@ "a": 255 }, "rect": { - "r_x0": 106.57, - "r_y0": 483.35, - "r_x1": 120.29, - "r_y1": 483.35, - "r_x2": 120.29, - "r_y2": 420.78, - "r_x3": 106.57, - "r_y3": 420.78, + "r_x0": 157.67, + "r_y0": 680.33, + "r_x1": 157.67, + "r_y1": 610.0, + "r_x2": 137.0, + "r_y2": 610.0, + "r_x3": 137.0, + "r_y3": 680.33, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true } ], "children": [] }, { - "id": 13, + "id": 3, "label": "text", "bbox": { - "l": 106.57, - "t": 307.16, - "r": 120.29, - "b": 369.73, + "l": 204.0, + "t": 623.33, + "r": 220.0, + "b": 670.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 2, @@ -2852,36 +3136,36 @@ "a": 255 }, "rect": { - "r_x0": 106.57, - "r_y0": 369.73, - "r_x1": 120.29, - "r_y1": 369.73, - "r_x2": 120.29, - "r_y2": 307.16, - "r_x3": 106.57, - "r_y3": 307.16, + "r_x0": 220.0, + "r_y0": 670.33, + "r_x1": 220.0, + "r_y1": 623.33, + "r_x2": 204.0, + "r_y2": 623.33, + "r_x3": 204.0, + "r_y3": 670.33, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 14, + "id": 4, "label": "text", "bbox": { - "l": 174.07, - "t": 641.33, - "r": 187.79, - "b": 718.48, + "l": 284.0, + "t": 623.33, + "r": 300.0, + "b": 670.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 3, @@ -2892,36 +3176,36 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 718.48, - "r_x1": 187.79, - "r_y1": 718.48, - "r_x2": 187.79, - "r_y2": 641.33, - "r_x3": 174.07, - "r_y3": 641.33, + "r_x0": 300.0, + "r_y0": 670.33, + "r_x1": 300.0, + "r_y1": 623.33, + "r_x2": 284.0, + "r_y2": 623.33, + "r_x3": 284.0, + "r_y3": 670.33, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 15, + "id": 5, "label": "text", "bbox": { - "l": 174.07, - "t": 531.29, - "r": 187.79, - "b": 600.35, + "l": 105.67, + "t": 428.0, + "r": 126.33, + "b": 559.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 91.0, "cells": [ { "index": 4, @@ -2932,36 +3216,36 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 600.35, - "r_x1": 187.79, - "r_y1": 600.35, - "r_x2": 187.79, - "r_y2": 531.29, - "r_x3": 174.07, - "r_y3": 531.29, + "r_x0": 126.33, + "r_y0": 559.67, + "r_x1": 126.33, + "r_y1": 428.0, + "r_x2": 105.67, + "r_y2": 428.0, + "r_x3": 105.67, + "r_y3": 559.67, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 91.0, + "from_ocr": true } ], "children": [] }, { - "id": 16, + "id": 6, "label": "text", "bbox": { - "l": 174.07, - "t": 410.9, - "r": 187.79, - "b": 494.6, + "l": 137.0, + "t": 456.0, + "r": 153.0, + "b": 526.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 5, @@ -2972,36 +3256,36 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 494.6, - "r_x1": 187.79, - "r_y1": 494.6, - "r_x2": 187.79, - "r_y2": 410.9, - "r_x3": 174.07, - "r_y3": 410.9, + "r_x0": 153.0, + "r_y0": 526.67, + "r_x1": 153.0, + "r_y1": 456.0, + "r_x2": 137.0, + "r_y2": 456.0, + "r_x3": 137.0, + "r_y3": 526.67, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true } ], "children": [] }, { - "id": 17, + "id": 7, "label": "text", "bbox": { - "l": 174.07, - "t": 326.21, - "r": 187.79, - "b": 350.6, + "l": 188.33, + "t": 442.33, + "r": 204.33, + "b": 545.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 6, @@ -3012,36 +3296,36 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 350.6, - "r_x1": 187.79, - "r_y1": 350.6, - "r_x2": 187.79, - "r_y2": 326.21, - "r_x3": 174.07, - "r_y3": 326.21, + "r_x0": 204.33, + "r_y0": 545.0, + "r_x1": 204.33, + "r_y1": 442.33, + "r_x2": 188.33, + "r_y2": 442.33, + "r_x3": 188.33, + "r_y3": 545.0, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true } ], "children": [] }, { - "id": 18, + "id": 8, "label": "text", "bbox": { - "l": 242.7, - "t": 647.54, - "r": 256.41, - "b": 711.73, + "l": 220.0, + "t": 468.0, + "r": 236.0, + "b": 515.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 7, @@ -3052,36 +3336,36 @@ "a": 255 }, "rect": { - "r_x0": 242.7, - "r_y0": 711.73, - "r_x1": 256.41, - "r_y1": 711.73, - "r_x2": 256.41, - "r_y2": 647.54, - "r_x3": 242.7, - "r_y3": 647.54, + "r_x0": 236.0, + "r_y0": 515.0, + "r_x1": 236.0, + "r_y1": 468.0, + "r_x2": 220.0, + "r_y2": 468.0, + "r_x3": 220.0, + "r_y3": 515.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 19, + "id": 9, "label": "text", "bbox": { - "l": 242.7, - "t": 435.41, - "r": 256.41, - "b": 468.73, + "l": 268.0, + "t": 442.33, + "r": 284.0, + "b": 545.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 93.0, "cells": [ { "index": 8, @@ -3092,36 +3376,36 @@ "a": 255 }, "rect": { - "r_x0": 242.7, - "r_y0": 468.73, - "r_x1": 256.41, - "r_y1": 468.73, - "r_x2": 256.41, - "r_y2": 435.41, - "r_x3": 242.7, - "r_y3": 435.41, + "r_x0": 284.0, + "r_y0": 545.0, + "r_x1": 284.0, + "r_y1": 442.33, + "r_x2": 268.0, + "r_y2": 442.33, + "r_x3": 268.0, + "r_y3": 545.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 93.0, + "from_ocr": true } ], "children": [] }, { - "id": 20, + "id": 10, "label": "text", "bbox": { - "l": 242.7, - "t": 323.39, - "r": 256.41, - "b": 355.1, + "l": 299.67, + "t": 468.0, + "r": 315.33, + "b": 515.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 9, @@ -3132,36 +3416,36 @@ "a": 255 }, "rect": { - "r_x0": 242.7, - "r_y0": 355.1, - "r_x1": 256.41, - "r_y1": 355.1, - "r_x2": 256.41, - "r_y2": 323.39, - "r_x3": 242.7, - "r_y3": 323.39, + "r_x0": 315.33, + "r_y0": 515.0, + "r_x1": 315.33, + "r_y1": 468.0, + "r_x2": 299.67, + "r_y2": 468.0, + "r_x3": 299.67, + "r_y3": 515.0, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 21, + "id": 11, "label": "text", "bbox": { - "l": 315.82, - "t": 634.24, - "r": 329.54, - "b": 725.23, + "l": 105.67, + "t": 274.0, + "r": 121.67, + "b": 385.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 10, @@ -3172,36 +3456,36 @@ "a": 255 }, "rect": { - "r_x0": 315.82, - "r_y0": 725.23, - "r_x1": 329.54, - "r_y1": 725.23, - "r_x2": 329.54, - "r_y2": 634.24, - "r_x3": 315.82, - "r_y3": 634.24, + "r_x0": 121.67, + "r_y0": 385.67, + "r_x1": 121.67, + "r_y1": 274.0, + "r_x2": 105.67, + "r_y2": 274.0, + "r_x3": 105.67, + "r_y3": 385.67, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true } ], "children": [] }, { - "id": 22, + "id": 12, "label": "text", "bbox": { - "l": 315.82, - "t": 542.27, - "r": 329.54, - "b": 590.23, + "l": 137.0, + "t": 292.67, + "r": 153.0, + "b": 363.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 11, @@ -3212,36 +3496,36 @@ "a": 255 }, "rect": { - "r_x0": 315.82, - "r_y0": 590.23, - "r_x1": 329.54, - "r_y1": 590.23, - "r_x2": 329.54, - "r_y2": 542.27, - "r_x3": 315.82, - "r_y3": 542.27, + "r_x0": 153.0, + "r_y0": 363.0, + "r_x1": 153.0, + "r_y1": 292.67, + "r_x2": 137.0, + "r_y2": 292.67, + "r_x3": 137.0, + "r_y3": 363.0, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 23, + "id": 13, "label": "text", "bbox": { - "l": 315.82, - "t": 319.15, - "r": 329.54, - "b": 357.35, + "l": 188.33, + "t": 278.0, + "r": 204.33, + "b": 384.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 12, @@ -3252,21 +3536,141 @@ "a": 255 }, "rect": { - "r_x0": 315.82, - "r_y0": 357.35, - "r_x1": 329.54, - "r_y1": 357.35, - "r_x2": 329.54, - "r_y2": 319.15, - "r_x3": 315.82, - "r_y3": 319.15, + "r_x0": 204.33, + "r_y0": 384.0, + "r_x1": 204.33, + "r_y1": 278.0, + "r_x2": 188.33, + "r_y2": 278.0, + "r_x3": 188.33, + "r_y3": 384.0, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 14, + "label": "text", + "bbox": { + "l": 220.0, + "t": 304.33, + "r": 236.0, + "b": 351.33, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 236.0, + "r_y0": 351.33, + "r_x1": 236.0, + "r_y1": 304.33, + "r_x2": 220.0, + "r_y2": 304.33, + "r_x3": 220.0, + "r_y3": 351.33, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 15, + "label": "text", + "bbox": { + "l": 268.0, + "t": 278.0, + "r": 284.0, + "b": 383.67, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 284.0, + "r_y0": 383.67, + "r_x1": 284.0, + "r_y1": 278.0, + "r_x2": 268.0, + "r_y2": 278.0, + "r_x3": 268.0, + "r_y3": 383.67, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 16, + "label": "text", + "bbox": { + "l": 299.67, + "t": 304.33, + "r": 315.33, + "b": 351.33, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 315.33, + "r_y0": 351.33, + "r_x1": 315.33, + "r_y1": 304.33, + "r_x2": 299.67, + "r_y2": 304.33, + "r_x3": 299.67, + "r_y3": 351.33, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "children": [] @@ -3275,278 +3679,22 @@ }, "text": null, "otsl_seq": [ - "fcel", - "fcel", - "fcel", - "fcel", + "ched", + "ched", + "ched", "nl", "fcel", "fcel", "fcel", - "ecel", "nl", "fcel", "fcel", - "ecel", - "fcel", - "nl", - "ecel", - "fcel", - "fcel", "fcel", "nl" ], - "num_rows": 4, - "num_cols": 4, - "table_cells": [ - { - "bbox": { - "l": 106.57, - "t": 534.41, - "r": 120.29, - "b": 596.98, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "Column 0", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 106.57, - "t": 420.78, - "r": 120.29, - "b": 483.35, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "Column 1", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 106.57, - "t": 307.16, - "r": 120.29, - "b": 369.73, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "Column 2", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 174.07, - "t": 641.33, - "r": 187.79, - "b": 718.48, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "this is row 0", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 174.07, - "t": 531.29, - "r": 187.79, - "b": 600.35, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "some cells", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 174.07, - "t": 410.9, - "r": 187.79, - "b": 494.6, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "have content", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 174.07, - "t": 326.21, - "r": 187.79, - "b": 350.6, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "and", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 242.7, - "t": 647.54, - "r": 256.41, - "b": 711.73, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "and row 1", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 242.7, - "t": 435.41, - "r": 256.41, - "b": 468.73, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "other", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 242.7, - "t": 323.39, - "r": 256.41, - "b": 355.1, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "have", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 315.82, - "t": 634.24, - "r": 329.54, - "b": 725.23, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "and last row 2", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 315.82, - "t": 542.27, - "r": 329.54, - "b": 590.23, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "nothing", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 315.82, - "t": 319.15, - "r": 329.54, - "b": 357.35, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "inside", - "column_header": false, - "row_header": false, - "row_section": false - } - ] + "num_rows": 0, + "num_cols": 0, + "table_cells": [] } ], "body": [ @@ -3558,13 +3706,13 @@ "id": 0, "label": "table", "bbox": { - "l": 75.13, - "t": 279.86, - "r": 361.19, - "b": 739.0, + "l": 87.65, + "t": 240.9, + "r": 334.58, + "b": 722.96, "coord_origin": "TOPLEFT" }, - "confidence": 0.947, + "confidence": 0.979, "cells": [ { "index": 0, @@ -3575,21 +3723,21 @@ "a": 255 }, "rect": { - "r_x0": 106.57, - "r_y0": 596.98, - "r_x1": 120.29, - "r_y1": 596.98, - "r_x2": 120.29, - "r_y2": 534.41, - "r_x3": 106.57, - "r_y3": 534.41, + "r_x0": 126.33, + "r_y0": 694.67, + "r_x1": 126.33, + "r_y1": 602.0, + "r_x2": 105.67, + "r_y2": 602.0, + "r_x3": 105.67, + "r_y3": 694.67, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true }, { "index": 1, @@ -3600,21 +3748,21 @@ "a": 255 }, "rect": { - "r_x0": 106.57, - "r_y0": 483.35, - "r_x1": 120.29, - "r_y1": 483.35, - "r_x2": 120.29, - "r_y2": 420.78, - "r_x3": 106.57, - "r_y3": 420.78, + "r_x0": 157.67, + "r_y0": 680.33, + "r_x1": 157.67, + "r_y1": 610.0, + "r_x2": 137.0, + "r_y2": 610.0, + "r_x3": 137.0, + "r_y3": 680.33, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true }, { "index": 2, @@ -3625,21 +3773,21 @@ "a": 255 }, "rect": { - "r_x0": 106.57, - "r_y0": 369.73, - "r_x1": 120.29, - "r_y1": 369.73, - "r_x2": 120.29, - "r_y2": 307.16, - "r_x3": 106.57, - "r_y3": 307.16, + "r_x0": 220.0, + "r_y0": 670.33, + "r_x1": 220.0, + "r_y1": 623.33, + "r_x2": 204.0, + "r_y2": 623.33, + "r_x3": 204.0, + "r_y3": 670.33, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 3, @@ -3650,21 +3798,21 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 718.48, - "r_x1": 187.79, - "r_y1": 718.48, - "r_x2": 187.79, - "r_y2": 641.33, - "r_x3": 174.07, - "r_y3": 641.33, + "r_x0": 300.0, + "r_y0": 670.33, + "r_x1": 300.0, + "r_y1": 623.33, + "r_x2": 284.0, + "r_y2": 623.33, + "r_x3": 284.0, + "r_y3": 670.33, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 4, @@ -3675,21 +3823,21 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 600.35, - "r_x1": 187.79, - "r_y1": 600.35, - "r_x2": 187.79, - "r_y2": 531.29, - "r_x3": 174.07, - "r_y3": 531.29, + "r_x0": 126.33, + "r_y0": 559.67, + "r_x1": 126.33, + "r_y1": 428.0, + "r_x2": 105.67, + "r_y2": 428.0, + "r_x3": 105.67, + "r_y3": 559.67, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 91.0, + "from_ocr": true }, { "index": 5, @@ -3700,21 +3848,21 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 494.6, - "r_x1": 187.79, - "r_y1": 494.6, - "r_x2": 187.79, - "r_y2": 410.9, - "r_x3": 174.07, - "r_y3": 410.9, + "r_x0": 153.0, + "r_y0": 526.67, + "r_x1": 153.0, + "r_y1": 456.0, + "r_x2": 137.0, + "r_y2": 456.0, + "r_x3": 137.0, + "r_y3": 526.67, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 6, @@ -3725,21 +3873,21 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 350.6, - "r_x1": 187.79, - "r_y1": 350.6, - "r_x2": 187.79, - "r_y2": 326.21, - "r_x3": 174.07, - "r_y3": 326.21, + "r_x0": 204.33, + "r_y0": 545.0, + "r_x1": 204.33, + "r_y1": 442.33, + "r_x2": 188.33, + "r_y2": 442.33, + "r_x3": 188.33, + "r_y3": 545.0, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 7, @@ -3750,21 +3898,21 @@ "a": 255 }, "rect": { - "r_x0": 242.7, - "r_y0": 711.73, - "r_x1": 256.41, - "r_y1": 711.73, - "r_x2": 256.41, - "r_y2": 647.54, - "r_x3": 242.7, - "r_y3": 647.54, + "r_x0": 236.0, + "r_y0": 515.0, + "r_x1": 236.0, + "r_y1": 468.0, + "r_x2": 220.0, + "r_y2": 468.0, + "r_x3": 220.0, + "r_y3": 515.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 8, @@ -3775,21 +3923,21 @@ "a": 255 }, "rect": { - "r_x0": 242.7, - "r_y0": 468.73, - "r_x1": 256.41, - "r_y1": 468.73, - "r_x2": 256.41, - "r_y2": 435.41, - "r_x3": 242.7, - "r_y3": 435.41, + "r_x0": 284.0, + "r_y0": 545.0, + "r_x1": 284.0, + "r_y1": 442.33, + "r_x2": 268.0, + "r_y2": 442.33, + "r_x3": 268.0, + "r_y3": 545.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 93.0, + "from_ocr": true }, { "index": 9, @@ -3800,21 +3948,21 @@ "a": 255 }, "rect": { - "r_x0": 242.7, - "r_y0": 355.1, - "r_x1": 256.41, - "r_y1": 355.1, - "r_x2": 256.41, - "r_y2": 323.39, - "r_x3": 242.7, - "r_y3": 323.39, + "r_x0": 315.33, + "r_y0": 515.0, + "r_x1": 315.33, + "r_y1": 468.0, + "r_x2": 299.67, + "r_y2": 468.0, + "r_x3": 299.67, + "r_y3": 515.0, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true }, { "index": 10, @@ -3825,21 +3973,21 @@ "a": 255 }, "rect": { - "r_x0": 315.82, - "r_y0": 725.23, - "r_x1": 329.54, - "r_y1": 725.23, - "r_x2": 329.54, - "r_y2": 634.24, - "r_x3": 315.82, - "r_y3": 634.24, + "r_x0": 121.67, + "r_y0": 385.67, + "r_x1": 121.67, + "r_y1": 274.0, + "r_x2": 105.67, + "r_y2": 274.0, + "r_x3": 105.67, + "r_y3": 385.67, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true }, { "index": 11, @@ -3850,21 +3998,21 @@ "a": 255 }, "rect": { - "r_x0": 315.82, - "r_y0": 590.23, - "r_x1": 329.54, - "r_y1": 590.23, - "r_x2": 329.54, - "r_y2": 542.27, - "r_x3": 315.82, - "r_y3": 542.27, + "r_x0": 153.0, + "r_y0": 363.0, + "r_x1": 153.0, + "r_y1": 292.67, + "r_x2": 137.0, + "r_y2": 292.67, + "r_x3": 137.0, + "r_y3": 363.0, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true }, { "index": 12, @@ -3875,35 +4023,110 @@ "a": 255 }, "rect": { - "r_x0": 315.82, - "r_y0": 357.35, - "r_x1": 329.54, - "r_y1": 357.35, - "r_x2": 329.54, - "r_y2": 319.15, - "r_x3": 315.82, - "r_y3": 319.15, + "r_x0": 204.33, + "r_y0": 384.0, + "r_x1": 204.33, + "r_y1": 278.0, + "r_x2": 188.33, + "r_y2": 278.0, + "r_x3": 188.33, + "r_y3": 384.0, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 236.0, + "r_y0": 351.33, + "r_x1": 236.0, + "r_y1": 304.33, + "r_x2": 220.0, + "r_y2": 304.33, + "r_x3": 220.0, + "r_y3": 351.33, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 284.0, + "r_y0": 383.67, + "r_x1": 284.0, + "r_y1": 278.0, + "r_x2": 268.0, + "r_y2": 278.0, + "r_x3": 268.0, + "r_y3": 383.67, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + }, + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 315.33, + "r_y0": 351.33, + "r_x1": 315.33, + "r_y1": 304.33, + "r_x2": 299.67, + "r_y2": 304.33, + "r_x3": 299.67, + "r_y3": 351.33, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "children": [ { - "id": 11, + "id": 1, "label": "text", "bbox": { - "l": 106.57, - "t": 534.41, - "r": 120.29, - "b": 596.98, + "l": 105.67, + "t": 602.0, + "r": 126.33, + "b": 694.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 90.0, "cells": [ { "index": 0, @@ -3914,36 +4137,36 @@ "a": 255 }, "rect": { - "r_x0": 106.57, - "r_y0": 596.98, - "r_x1": 120.29, - "r_y1": 596.98, - "r_x2": 120.29, - "r_y2": 534.41, - "r_x3": 106.57, - "r_y3": 534.41, + "r_x0": 126.33, + "r_y0": 694.67, + "r_x1": 126.33, + "r_y1": 602.0, + "r_x2": 105.67, + "r_y2": 602.0, + "r_x3": 105.67, + "r_y3": 694.67, "coord_origin": "TOPLEFT" }, - "text": "Column 0", - "orig": "Column 0", + "text": "Vertically", + "orig": "Vertically", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 90.0, + "from_ocr": true } ], "children": [] }, { - "id": 12, + "id": 2, "label": "text", "bbox": { - "l": 106.57, - "t": 420.78, - "r": 120.29, - "b": 483.35, + "l": 137.0, + "t": 610.0, + "r": 157.67, + "b": 680.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 92.0, "cells": [ { "index": 1, @@ -3954,36 +4177,36 @@ "a": 255 }, "rect": { - "r_x0": 106.57, - "r_y0": 483.35, - "r_x1": 120.29, - "r_y1": 483.35, - "r_x2": 120.29, - "r_y2": 420.78, - "r_x3": 106.57, - "r_y3": 420.78, + "r_x0": 157.67, + "r_y0": 680.33, + "r_x1": 157.67, + "r_y1": 610.0, + "r_x2": 137.0, + "r_y2": 610.0, + "r_x3": 137.0, + "r_y3": 680.33, "coord_origin": "TOPLEFT" }, - "text": "Column 1", - "orig": "Column 1", + "text": "merged", + "orig": "merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 92.0, + "from_ocr": true } ], "children": [] }, { - "id": 13, + "id": 3, "label": "text", "bbox": { - "l": 106.57, - "t": 307.16, - "r": 120.29, - "b": 369.73, + "l": 204.0, + "t": 623.33, + "r": 220.0, + "b": 670.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 2, @@ -3994,36 +4217,36 @@ "a": 255 }, "rect": { - "r_x0": 106.57, - "r_y0": 369.73, - "r_x1": 120.29, - "r_y1": 369.73, - "r_x2": 120.29, - "r_y2": 307.16, - "r_x3": 106.57, - "r_y3": 307.16, + "r_x0": 220.0, + "r_y0": 670.33, + "r_x1": 220.0, + "r_y1": 623.33, + "r_x2": 204.0, + "r_y2": 623.33, + "r_x3": 204.0, + "r_y3": 670.33, "coord_origin": "TOPLEFT" }, - "text": "Column 2", - "orig": "Column 2", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 14, + "id": 4, "label": "text", "bbox": { - "l": 174.07, - "t": 641.33, - "r": 187.79, - "b": 718.48, + "l": 284.0, + "t": 623.33, + "r": 300.0, + "b": 670.33, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 3, @@ -4034,36 +4257,36 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 718.48, - "r_x1": 187.79, - "r_y1": 718.48, - "r_x2": 187.79, - "r_y2": 641.33, - "r_x3": 174.07, - "r_y3": 641.33, + "r_x0": 300.0, + "r_y0": 670.33, + "r_x1": 300.0, + "r_y1": 623.33, + "r_x2": 284.0, + "r_y2": 623.33, + "r_x3": 284.0, + "r_y3": 670.33, "coord_origin": "TOPLEFT" }, - "text": "this is row 0", - "orig": "this is row 0", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 15, + "id": 5, "label": "text", "bbox": { - "l": 174.07, - "t": 531.29, - "r": 187.79, - "b": 600.35, + "l": 105.67, + "t": 428.0, + "r": 126.33, + "b": 559.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 91.0, "cells": [ { "index": 4, @@ -4074,36 +4297,36 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 600.35, - "r_x1": 187.79, - "r_y1": 600.35, - "r_x2": 187.79, - "r_y2": 531.29, - "r_x3": 174.07, - "r_y3": 531.29, + "r_x0": 126.33, + "r_y0": 559.67, + "r_x1": 126.33, + "r_y1": 428.0, + "r_x2": 105.67, + "r_y2": 428.0, + "r_x3": 105.67, + "r_y3": 559.67, "coord_origin": "TOPLEFT" }, - "text": "some cells", - "orig": "some cells", + "text": "Other merged", + "orig": "Other merged", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 91.0, + "from_ocr": true } ], "children": [] }, { - "id": 16, + "id": 6, "label": "text", "bbox": { - "l": 174.07, - "t": 410.9, - "r": 187.79, - "b": 494.6, + "l": 137.0, + "t": 456.0, + "r": 153.0, + "b": 526.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 5, @@ -4114,36 +4337,36 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 494.6, - "r_x1": 187.79, - "r_y1": 494.6, - "r_x2": 187.79, - "r_y2": 410.9, - "r_x3": 174.07, - "r_y3": 410.9, + "r_x0": 153.0, + "r_y0": 526.67, + "r_x1": 153.0, + "r_y1": 456.0, + "r_x2": 137.0, + "r_y2": 456.0, + "r_x3": 137.0, + "r_y3": 526.67, "coord_origin": "TOPLEFT" }, - "text": "have content", - "orig": "have content", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true } ], "children": [] }, { - "id": 17, + "id": 7, "label": "text", "bbox": { - "l": 174.07, - "t": 326.21, - "r": 187.79, - "b": 350.6, + "l": 188.33, + "t": 442.33, + "r": 204.33, + "b": 545.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 6, @@ -4154,36 +4377,36 @@ "a": 255 }, "rect": { - "r_x0": 174.07, - "r_y0": 350.6, - "r_x1": 187.79, - "r_y1": 350.6, - "r_x2": 187.79, - "r_y2": 326.21, - "r_x3": 174.07, - "r_y3": 326.21, + "r_x0": 204.33, + "r_y0": 545.0, + "r_x1": 204.33, + "r_y1": 442.33, + "r_x2": 188.33, + "r_y2": 442.33, + "r_x3": 188.33, + "r_y3": 545.0, "coord_origin": "TOPLEFT" }, - "text": "and", - "orig": "and", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true } ], "children": [] }, { - "id": 18, + "id": 8, "label": "text", "bbox": { - "l": 242.7, - "t": 647.54, - "r": 256.41, - "b": 711.73, + "l": 220.0, + "t": 468.0, + "r": 236.0, + "b": 515.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 7, @@ -4194,36 +4417,36 @@ "a": 255 }, "rect": { - "r_x0": 242.7, - "r_y0": 711.73, - "r_x1": 256.41, - "r_y1": 711.73, - "r_x2": 256.41, - "r_y2": 647.54, - "r_x3": 242.7, - "r_y3": 647.54, + "r_x0": 236.0, + "r_y0": 515.0, + "r_x1": 236.0, + "r_y1": 468.0, + "r_x2": 220.0, + "r_y2": 468.0, + "r_x3": 220.0, + "r_y3": 515.0, "coord_origin": "TOPLEFT" }, - "text": "and row 1", - "orig": "and row 1", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 19, + "id": 9, "label": "text", "bbox": { - "l": 242.7, - "t": 435.41, - "r": 256.41, - "b": 468.73, + "l": 268.0, + "t": 442.33, + "r": 284.0, + "b": 545.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 93.0, "cells": [ { "index": 8, @@ -4234,36 +4457,36 @@ "a": 255 }, "rect": { - "r_x0": 242.7, - "r_y0": 468.73, - "r_x1": 256.41, - "r_y1": 468.73, - "r_x2": 256.41, - "r_y2": 435.41, - "r_x3": 242.7, - "r_y3": 435.41, + "r_x0": 284.0, + "r_y0": 545.0, + "r_x1": 284.0, + "r_y1": 442.33, + "r_x2": 268.0, + "r_y2": 442.33, + "r_x3": 268.0, + "r_y3": 545.0, "coord_origin": "TOPLEFT" }, - "text": "other", - "orig": "other", + "text": "Some other", + "orig": "Some other", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 93.0, + "from_ocr": true } ], "children": [] }, { - "id": 20, + "id": 10, "label": "text", "bbox": { - "l": 242.7, - "t": 323.39, - "r": 256.41, - "b": 355.1, + "l": 299.67, + "t": 468.0, + "r": 315.33, + "b": 515.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 96.0, "cells": [ { "index": 9, @@ -4274,36 +4497,36 @@ "a": 255 }, "rect": { - "r_x0": 242.7, - "r_y0": 355.1, - "r_x1": 256.41, - "r_y1": 355.1, - "r_x2": 256.41, - "r_y2": 323.39, - "r_x3": 242.7, - "r_y3": 323.39, + "r_x0": 315.33, + "r_y0": 515.0, + "r_x1": 315.33, + "r_y1": 468.0, + "r_x2": 299.67, + "r_y2": 468.0, + "r_x3": 299.67, + "r_y3": 515.0, "coord_origin": "TOPLEFT" }, - "text": "have", - "orig": "have", + "text": "value", + "orig": "value", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 96.0, + "from_ocr": true } ], "children": [] }, { - "id": 21, + "id": 11, "label": "text", "bbox": { - "l": 315.82, - "t": 634.24, - "r": 329.54, - "b": 725.23, + "l": 105.67, + "t": 274.0, + "r": 121.67, + "b": 385.67, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 10, @@ -4314,36 +4537,36 @@ "a": 255 }, "rect": { - "r_x0": 315.82, - "r_y0": 725.23, - "r_x1": 329.54, - "r_y1": 725.23, - "r_x2": 329.54, - "r_y2": 634.24, - "r_x3": 315.82, - "r_y3": 634.24, + "r_x0": 121.67, + "r_y0": 385.67, + "r_x1": 121.67, + "r_y1": 274.0, + "r_x2": 105.67, + "r_y2": 274.0, + "r_x3": 105.67, + "r_y3": 385.67, "coord_origin": "TOPLEFT" }, - "text": "and last row 2", - "orig": "and last row 2", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true } ], "children": [] }, { - "id": 22, + "id": 12, "label": "text", "bbox": { - "l": 315.82, - "t": 542.27, - "r": 329.54, - "b": 590.23, + "l": 137.0, + "t": 292.67, + "r": 153.0, + "b": 363.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 94.0, "cells": [ { "index": 11, @@ -4354,36 +4577,36 @@ "a": 255 }, "rect": { - "r_x0": 315.82, - "r_y0": 590.23, - "r_x1": 329.54, - "r_y1": 590.23, - "r_x2": 329.54, - "r_y2": 542.27, - "r_x3": 315.82, - "r_y3": 542.27, + "r_x0": 153.0, + "r_y0": 363.0, + "r_x1": 153.0, + "r_y1": 292.67, + "r_x2": 137.0, + "r_y2": 292.67, + "r_x3": 137.0, + "r_y3": 363.0, "coord_origin": "TOPLEFT" }, - "text": "nothing", - "orig": "nothing", + "text": "column", + "orig": "column", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 94.0, + "from_ocr": true } ], "children": [] }, { - "id": 23, + "id": 13, "label": "text", "bbox": { - "l": 315.82, - "t": 319.15, - "r": 329.54, - "b": 357.35, + "l": 188.33, + "t": 278.0, + "r": 204.33, + "b": 384.0, "coord_origin": "TOPLEFT" }, - "confidence": 1.0, + "confidence": 95.0, "cells": [ { "index": 12, @@ -4394,21 +4617,141 @@ "a": 255 }, "rect": { - "r_x0": 315.82, - "r_y0": 357.35, - "r_x1": 329.54, - "r_y1": 357.35, - "r_x2": 329.54, - "r_y2": 319.15, - "r_x3": 315.82, - "r_y3": 319.15, + "r_x0": 204.33, + "r_y0": 384.0, + "r_x1": 204.33, + "r_y1": 278.0, + "r_x2": 188.33, + "r_y2": 278.0, + "r_x3": 188.33, + "r_y3": 384.0, "coord_origin": "TOPLEFT" }, - "text": "inside", - "orig": "inside", + "text": "Yet another", + "orig": "Yet another", "text_direction": "left_to_right", - "confidence": 1.0, - "from_ocr": false + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 14, + "label": "text", + "bbox": { + "l": 220.0, + "t": 304.33, + "r": 236.0, + "b": 351.33, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 13, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 236.0, + "r_y0": 351.33, + "r_x1": 236.0, + "r_y1": 304.33, + "r_x2": 220.0, + "r_y2": 304.33, + "r_x3": 220.0, + "r_y3": 351.33, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 15, + "label": "text", + "bbox": { + "l": 268.0, + "t": 278.0, + "r": 284.0, + "b": 383.67, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 14, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 284.0, + "r_y0": 383.67, + "r_x1": 284.0, + "r_y1": 278.0, + "r_x2": 268.0, + "r_y2": 278.0, + "r_x3": 268.0, + "r_y3": 383.67, + "coord_origin": "TOPLEFT" + }, + "text": "Yet another", + "orig": "Yet another", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true + } + ], + "children": [] + }, + { + "id": 16, + "label": "text", + "bbox": { + "l": 299.67, + "t": 304.33, + "r": 315.33, + "b": 351.33, + "coord_origin": "TOPLEFT" + }, + "confidence": 95.0, + "cells": [ + { + "index": 15, + "rgba": { + "r": 0, + "g": 0, + "b": 0, + "a": 255 + }, + "rect": { + "r_x0": 315.33, + "r_y0": 351.33, + "r_x1": 315.33, + "r_y1": 304.33, + "r_x2": 299.67, + "r_y2": 304.33, + "r_x3": 299.67, + "r_y3": 351.33, + "coord_origin": "TOPLEFT" + }, + "text": "value", + "orig": "value", + "text_direction": "left_to_right", + "confidence": 95.0, + "from_ocr": true } ], "children": [] @@ -4417,278 +4760,22 @@ }, "text": null, "otsl_seq": [ - "fcel", - "fcel", - "fcel", - "fcel", + "ched", + "ched", + "ched", "nl", "fcel", "fcel", "fcel", - "ecel", "nl", "fcel", "fcel", - "ecel", - "fcel", - "nl", - "ecel", - "fcel", - "fcel", "fcel", "nl" ], - "num_rows": 4, - "num_cols": 4, - "table_cells": [ - { - "bbox": { - "l": 106.57, - "t": 534.41, - "r": 120.29, - "b": 596.98, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "Column 0", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 106.57, - "t": 420.78, - "r": 120.29, - "b": 483.35, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "Column 1", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 106.57, - "t": 307.16, - "r": 120.29, - "b": 369.73, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 0, - "end_col_offset_idx": 1, - "text": "Column 2", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 174.07, - "t": 641.33, - "r": 187.79, - "b": 718.48, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "this is row 0", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 174.07, - "t": 531.29, - "r": 187.79, - "b": 600.35, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "some cells", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 174.07, - "t": 410.9, - "r": 187.79, - "b": 494.6, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "have content", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 174.07, - "t": 326.21, - "r": 187.79, - "b": 350.6, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 1, - "end_col_offset_idx": 2, - "text": "and", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 242.7, - "t": 647.54, - "r": 256.41, - "b": 711.73, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "and row 1", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 242.7, - "t": 435.41, - "r": 256.41, - "b": 468.73, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 1, - "end_row_offset_idx": 2, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "other", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 242.7, - "t": 323.39, - "r": 256.41, - "b": 355.1, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 2, - "end_col_offset_idx": 3, - "text": "have", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 315.82, - "t": 634.24, - "r": 329.54, - "b": 725.23, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 3, - "end_row_offset_idx": 4, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "and last row 2", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 315.82, - "t": 542.27, - "r": 329.54, - "b": 590.23, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 2, - "end_row_offset_idx": 3, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "nothing", - "column_header": false, - "row_header": false, - "row_section": false - }, - { - "bbox": { - "l": 315.82, - "t": 319.15, - "r": 329.54, - "b": 357.35, - "coord_origin": "TOPLEFT" - }, - "row_span": 1, - "col_span": 1, - "start_row_offset_idx": 0, - "end_row_offset_idx": 1, - "start_col_offset_idx": 3, - "end_col_offset_idx": 4, - "text": "inside", - "column_header": false, - "row_header": false, - "row_section": false - } - ] + "num_rows": 0, + "num_cols": 0, + "table_cells": [] } ], "headers": [] diff --git a/tests/data_scanned/ocr_test.pdf b/tests/data_scanned/ocr_test.pdf index d7f83728..7d14233e 100644 Binary files a/tests/data_scanned/ocr_test.pdf and b/tests/data_scanned/ocr_test.pdf differ diff --git a/tests/data_scanned/ocr_test_rotated_180.pdf b/tests/data_scanned/ocr_test_rotated_180.pdf index 22529b46..959da830 100644 Binary files a/tests/data_scanned/ocr_test_rotated_180.pdf and b/tests/data_scanned/ocr_test_rotated_180.pdf differ diff --git a/tests/data_scanned/ocr_test_rotated_270.pdf b/tests/data_scanned/ocr_test_rotated_270.pdf index ccf3c612..ebd482db 100644 Binary files a/tests/data_scanned/ocr_test_rotated_270.pdf and b/tests/data_scanned/ocr_test_rotated_270.pdf differ diff --git a/tests/data_scanned/ocr_test_rotated_90.pdf b/tests/data_scanned/ocr_test_rotated_90.pdf index 3aa4904b..f1447723 100644 Binary files a/tests/data_scanned/ocr_test_rotated_90.pdf and b/tests/data_scanned/ocr_test_rotated_90.pdf differ diff --git a/tests/test_e2e_ocr_conversion.py b/tests/test_e2e_ocr_conversion.py index 22cddf06..e67ea05f 100644 --- a/tests/test_e2e_ocr_conversion.py +++ b/tests/test_e2e_ocr_conversion.py @@ -57,24 +57,24 @@ def test_e2e_conversions(): engines: List[Tuple[OcrOptions, bool]] = [ (TesseractOcrOptions(), True), - # (TesseractCliOcrOptions(), True), - # (EasyOcrOptions(), False), - # (TesseractOcrOptions(force_full_page_ocr=True), True), - # (TesseractOcrOptions(force_full_page_ocr=True, lang=["auto"]), True), - # (TesseractCliOcrOptions(force_full_page_ocr=True), True), - # (TesseractCliOcrOptions(force_full_page_ocr=True, lang=["auto"]), True), - # (EasyOcrOptions(force_full_page_ocr=True), False), + (TesseractCliOcrOptions(), True), + (EasyOcrOptions(), False), + (TesseractOcrOptions(force_full_page_ocr=True), True), + (TesseractOcrOptions(force_full_page_ocr=True, lang=["auto"]), True), + (TesseractCliOcrOptions(force_full_page_ocr=True), True), + (TesseractCliOcrOptions(force_full_page_ocr=True, lang=["auto"]), True), + (EasyOcrOptions(force_full_page_ocr=True), False), ] - # - # # rapidocr is only available for Python >=3.6,<3.13 - # if sys.version_info < (3, 13): - # engines.append((RapidOcrOptions(), False)) - # engines.append((RapidOcrOptions(force_full_page_ocr=True), False)) - # - # # only works on mac - # if "darwin" == sys.platform: - # engines.append((OcrMacOptions(), True)) - # engines.append((OcrMacOptions(force_full_page_ocr=True), True)) + + # rapidocr is only available for Python >=3.6,<3.13 + if sys.version_info < (3, 13): + engines.append((RapidOcrOptions(), False)) + engines.append((RapidOcrOptions(force_full_page_ocr=True), False)) + + # only works on mac + if "darwin" == sys.platform: + engines.append((OcrMacOptions(), False)) + engines.append((OcrMacOptions(force_full_page_ocr=True), False)) for ocr_options, supports_rotation in engines: print(