mirror of
https://github.com/DS4SD/docling.git
synced 2025-07-29 13:34:21 +00:00
1 line
435 KiB
JSON
1 line
435 KiB
JSON
[{"page_no": 0, "page_hash": "e5a43ce8befcd91b5ee3d4c9bc04e620d34610ac0bc0b316fd0a28a82e456761", "size": {"width": 612.0530395507812, "height": 792.0686645507812}, "cells": [{"id": 0, "text": "TableFormer:", "bbox": {"l": 133.0, "t": 110.0, "r": 203.0, "b": 118.66666666666663, "coord_origin": "1"}}, {"id": 1, "text": "Table", "bbox": {"l": 207.66666666666666, "t": 110.0, "r": 235.33333333333334, "b": 118.66666666666663, "coord_origin": "1"}}, {"id": 2, "text": "Structure", "bbox": {"l": 239.0, "t": 110.0, "r": 287.3333333333333, "b": 118.66666666666663, "coord_origin": "1"}}, {"id": 3, "text": "Understanding", "bbox": {"l": 290.6666666666667, "t": 110.0, "r": 366.6666666666667, "b": 121.0, "coord_origin": "1"}}, {"id": 4, "text": "with", "bbox": {"l": 370.3333333333333, "t": 110.0, "r": 392.3333333333333, "b": 118.66666666666663, "coord_origin": "1"}}, {"id": 5, "text": "Transformers", "bbox": {"l": 395.6666666666667, "t": 110.0, "r": 465.0, "b": 118.66666666666663, "coord_origin": "1"}}, {"id": 6, "text": "Supplementary", "bbox": {"l": 220.66666666666666, "t": 121.66666666666663, "r": 315.6666666666667, "b": 135.33333333333337, "coord_origin": "1"}}, {"id": 7, "text": "Material", "bbox": {"l": 321.6666666666667, "t": 121.66666666666663, "r": 374.6666666666667, "b": 132.33333333333337, "coord_origin": "1"}}, {"id": 8, "text": "1.", "bbox": {"l": 51.0, "t": 160.66666666666663, "r": 58.666666666666664, "b": 169.0, "coord_origin": "1"}}, {"id": 9, "text": "Details", "bbox": {"l": 62.333333333333336, "t": 160.33333333333337, "r": 97.0, "b": 169.0, "coord_origin": "1"}}, {"id": 10, "text": "on", "bbox": {"l": 100.33333333333333, "t": 163.0, "r": 112.66666666666667, "b": 169.0, "coord_origin": "1"}}, {"id": 11, "text": "the", "bbox": {"l": 116.0, "t": 160.66666666666663, "r": 131.66666666666666, "b": 169.0, "coord_origin": "1"}}, {"id": 12, "text": "datasets", "bbox": {"l": 135.0, "t": 160.66666666666663, "r": 175.66666666666666, "b": 169.0, "coord_origin": "1"}}, {"id": 13, "text": "1.1.", "bbox": {"l": 51.0, "t": 180.33333333333337, "r": 66.0, "b": 188.33333333333337, "coord_origin": "1"}}, {"id": 14, "text": "Data", "bbox": {"l": 69.66666666666667, "t": 180.33333333333337, "r": 91.33333333333333, "b": 188.33333333333337, "coord_origin": "1"}}, {"id": 15, "text": "preparation", "bbox": {"l": 94.66666666666667, "t": 180.33333333333337, "r": 150.0, "b": 190.33333333333337, "coord_origin": "1"}}, {"id": 16, "text": "As", "bbox": {"l": 62.333333333333336, "t": 199.66666666666663, "r": 72.66666666666667, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 17, "text": "a", "bbox": {"l": 74.0, "t": 198.0, "r": 78.0, "b": 210.0, "coord_origin": "1"}}, {"id": 18, "text": "first", "bbox": {"l": 84.33333333333333, "t": 199.33333333333337, "r": 99.0, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 19, "text": "step", "bbox": {"l": 102.66666666666667, "t": 200.66666666666663, "r": 118.0, "b": 208.66666666666663, "coord_origin": "1"}}, {"id": 20, "text": "of", "bbox": {"l": 121.66666666666667, "t": 199.33333333333337, "r": 130.33333333333334, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 21, "text": "our", "bbox": {"l": 133.33333333333334, "t": 201.66666666666663, "r": 146.33333333333334, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 22, "text": "data", "bbox": {"l": 149.33333333333334, "t": 199.33333333333337, "r": 165.66666666666666, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 23, "text": "preparation", "bbox": {"l": 169.33333333333334, "t": 199.33333333333337, "r": 214.0, "b": 208.66666666666663, "coord_origin": "1"}}, {"id": 24, "text": "process,", "bbox": {"l": 217.66666666666666, "t": 201.66666666666663, "r": 249.33333333333334, "b": 208.66666666666663, "coord_origin": "1"}}, {"id": 25, "text": "we", "bbox": {"l": 253.33333333333334, "t": 201.66666666666663, "r": 264.3333333333333, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 26, "text": "have", "bbox": {"l": 268.3333333333333, "t": 199.33333333333337, "r": 286.0, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 27, "text": "calculated", "bbox": {"l": 50.333333333333336, "t": 211.33333333333337, "r": 90.0, "b": 218.33333333333337, "coord_origin": "1"}}, {"id": 28, "text": "statistics", "bbox": {"l": 94.33333333333333, "t": 211.33333333333337, "r": 128.0, "b": 218.33333333333337, "coord_origin": "1"}}, {"id": 29, "text": "over", "bbox": {"l": 132.0, "t": 213.66666666666663, "r": 149.33333333333334, "b": 218.33333333333337, "coord_origin": "1"}}, {"id": 30, "text": "the", "bbox": {"l": 153.0, "t": 211.33333333333337, "r": 164.66666666666666, "b": 218.33333333333337, "coord_origin": "1"}}, {"id": 31, "text": "datasets", "bbox": {"l": 168.66666666666666, "t": 211.33333333333337, "r": 199.66666666666666, "b": 218.33333333333337, "coord_origin": "1"}}, {"id": 32, "text": "across", "bbox": {"l": 204.0, "t": 213.66666666666663, "r": 228.0, "b": 218.33333333333337, "coord_origin": "1"}}, {"id": 33, "text": "the", "bbox": {"l": 232.33333333333334, "t": 211.33333333333337, "r": 244.0, "b": 218.33333333333337, "coord_origin": "1"}}, {"id": 34, "text": "following", "bbox": {"l": 248.33333333333334, "t": 211.33333333333337, "r": 286.0, "b": 220.66666666666663, "coord_origin": "1"}}, {"id": 35, "text": "dimensions:", "bbox": {"l": 50.333333333333336, "t": 223.33333333333337, "r": 97.33333333333333, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 36, "text": "(1)", "bbox": {"l": 102.33333333333333, "t": 223.66666666666663, "r": 113.0, "b": 231.66666666666663, "coord_origin": "1"}}, {"id": 37, "text": "table", "bbox": {"l": 116.66666666666667, "t": 223.33333333333337, "r": 135.33333333333334, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 38, "text": "size", "bbox": {"l": 138.66666666666666, "t": 223.33333333333337, "r": 153.33333333333334, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 39, "text": "measured", "bbox": {"l": 157.0, "t": 223.33333333333337, "r": 194.33333333333334, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 40, "text": "in", "bbox": {"l": 198.0, "t": 223.33333333333337, "r": 205.0, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 41, "text": "the", "bbox": {"l": 208.33333333333334, "t": 223.33333333333337, "r": 220.0, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 42, "text": "number", "bbox": {"l": 223.33333333333334, "t": 223.33333333333337, "r": 253.33333333333334, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 43, "text": "of", "bbox": {"l": 256.3333333333333, "t": 223.33333333333337, "r": 265.0, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 44, "text": "rows", "bbox": {"l": 267.3333333333333, "t": 225.66666666666663, "r": 286.0, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 45, "text": "and", "bbox": {"l": 50.333333333333336, "t": 235.33333333333337, "r": 64.0, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 46, "text": "columns,", "bbox": {"l": 67.66666666666667, "t": 235.33333333333337, "r": 103.66666666666667, "b": 243.33333333333337, "coord_origin": "1"}}, {"id": 47, "text": "(2)", "bbox": {"l": 108.0, "t": 235.33333333333337, "r": 118.66666666666667, "b": 243.66666666666663, "coord_origin": "1"}}, {"id": 48, "text": "complexity", "bbox": {"l": 122.66666666666667, "t": 235.33333333333337, "r": 166.66666666666666, "b": 244.66666666666663, "coord_origin": "1"}}, {"id": 49, "text": "of", "bbox": {"l": 170.66666666666666, "t": 235.33333333333337, "r": 179.0, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 50, "text": "the", "bbox": {"l": 182.33333333333334, "t": 235.33333333333337, "r": 193.66666666666666, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 51, "text": "table,", "bbox": {"l": 197.66666666666666, "t": 235.33333333333337, "r": 218.66666666666666, "b": 243.33333333333337, "coord_origin": "1"}}, {"id": 52, "text": "(3)", "bbox": {"l": 223.0, "t": 235.33333333333337, "r": 234.0, "b": 243.66666666666663, "coord_origin": "1"}}, {"id": 53, "text": "strictness", "bbox": {"l": 238.0, "t": 235.33333333333337, "r": 274.3333333333333, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 54, "text": "of", "bbox": {"l": 278.3333333333333, "t": 235.33333333333337, "r": 286.6666666666667, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 55, "text": "the", "bbox": {"l": 50.333333333333336, "t": 247.33333333333337, "r": 62.0, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 56, "text": "provided", "bbox": {"l": 65.0, "t": 247.33333333333337, "r": 99.66666666666667, "b": 256.66666666666674, "coord_origin": "1"}}, {"id": 57, "text": "HTML", "bbox": {"l": 103.0, "t": 247.33333333333337, "r": 130.66666666666666, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 58, "text": "structure", "bbox": {"l": 133.66666666666666, "t": 248.66666666666663, "r": 167.66666666666666, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 59, "text": "and", "bbox": {"l": 170.66666666666666, "t": 247.33333333333337, "r": 184.66666666666666, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 60, "text": "(4)", "bbox": {"l": 187.66666666666666, "t": 247.33333333333337, "r": 198.66666666666666, "b": 255.66666666666663, "coord_origin": "1"}}, {"id": 61, "text": "completeness", "bbox": {"l": 201.66666666666666, "t": 247.33333333333337, "r": 255.0, "b": 256.66666666666674, "coord_origin": "1"}}, {"id": 62, "text": "(i.e.", "bbox": {"l": 258.3333333333333, "t": 247.33333333333337, "r": 272.6666666666667, "b": 255.66666666666663, "coord_origin": "1"}}, {"id": 63, "text": "no", "bbox": {"l": 276.6666666666667, "t": 249.66666666666663, "r": 286.0, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 64, "text": "omitted", "bbox": {"l": 50.333333333333336, "t": 259.33333333333326, "r": 80.0, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 65, "text": "bounding", "bbox": {"l": 82.66666666666667, "t": 259.33333333333326, "r": 120.0, "b": 268.66666666666674, "coord_origin": "1"}}, {"id": 66, "text": "boxes).", "bbox": {"l": 122.33333333333333, "t": 259.33333333333326, "r": 150.33333333333334, "b": 267.66666666666674, "coord_origin": "1"}}, {"id": 67, "text": "A", "bbox": {"l": 155.0, "t": 259.66666666666674, "r": 158.0, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 68, "text": "table", "bbox": {"l": 163.66666666666666, "t": 259.33333333333326, "r": 182.33333333333334, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 69, "text": "is", "bbox": {"l": 185.0, "t": 259.33333333333326, "r": 191.0, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 70, "text": "considered", "bbox": {"l": 193.33333333333334, "t": 259.33333333333326, "r": 236.0, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 71, "text": "to", "bbox": {"l": 239.0, "t": 260.66666666666674, "r": 246.0, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 72, "text": "be", "bbox": {"l": 248.66666666666666, "t": 259.33333333333326, "r": 257.3333333333333, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 73, "text": "simple", "bbox": {"l": 260.0, "t": 259.33333333333326, "r": 286.0, "b": 268.66666666666674, "coord_origin": "1"}}, {"id": 74, "text": "if", "bbox": {"l": 50.333333333333336, "t": 271.33333333333326, "r": 56.666666666666664, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 75, "text": "it", "bbox": {"l": 59.0, "t": 271.33333333333326, "r": 63.666666666666664, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 76, "text": "does", "bbox": {"l": 66.66666666666667, "t": 271.33333333333326, "r": 84.66666666666667, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 77, "text": "not", "bbox": {"l": 87.66666666666667, "t": 272.66666666666674, "r": 99.66666666666667, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 78, "text": "contain", "bbox": {"l": 102.66666666666667, "t": 271.33333333333326, "r": 131.66666666666666, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 79, "text": "row", "bbox": {"l": 134.66666666666666, "t": 273.66666666666674, "r": 149.33333333333334, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 80, "text": "spans", "bbox": {"l": 152.33333333333334, "t": 273.66666666666674, "r": 174.0, "b": 280.6666666666667, "coord_origin": "1"}}, {"id": 81, "text": "or", "bbox": {"l": 177.0, "t": 273.66666666666674, "r": 185.0, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 82, "text": "column", "bbox": {"l": 187.66666666666666, "t": 271.33333333333326, "r": 217.0, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 83, "text": "spans.", "bbox": {"l": 220.33333333333334, "t": 273.66666666666674, "r": 244.0, "b": 280.6666666666667, "coord_origin": "1"}}, {"id": 84, "text": "Addition-", "bbox": {"l": 248.0, "t": 271.33333333333326, "r": 286.0, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 85, "text": "ally,", "bbox": {"l": 50.333333333333336, "t": 283.0, "r": 66.33333333333333, "b": 292.0, "coord_origin": "1"}}, {"id": 86, "text": "a", "bbox": {"l": 69.33333333333333, "t": 285.0, "r": 73.33333333333333, "b": 290.0, "coord_origin": "1"}}, {"id": 87, "text": "table", "bbox": {"l": 76.0, "t": 283.0, "r": 94.66666666666667, "b": 290.0, "coord_origin": "1"}}, {"id": 88, "text": "has", "bbox": {"l": 97.66666666666667, "t": 283.0, "r": 110.33333333333333, "b": 290.0, "coord_origin": "1"}}, {"id": 89, "text": "a", "bbox": {"l": 113.0, "t": 285.0, "r": 117.0, "b": 290.0, "coord_origin": "1"}}, {"id": 90, "text": "strict", "bbox": {"l": 120.0, "t": 283.0, "r": 139.0, "b": 290.0, "coord_origin": "1"}}, {"id": 91, "text": "HTML", "bbox": {"l": 142.0, "t": 283.0, "r": 169.66666666666666, "b": 290.0, "coord_origin": "1"}}, {"id": 92, "text": "structure", "bbox": {"l": 172.33333333333334, "t": 284.3333333333333, "r": 206.33333333333334, "b": 290.0, "coord_origin": "1"}}, {"id": 93, "text": "if", "bbox": {"l": 209.33333333333334, "t": 283.0, "r": 215.66666666666666, "b": 290.0, "coord_origin": "1"}}, {"id": 94, "text": "every", "bbox": {"l": 217.33333333333334, "t": 285.0, "r": 238.66666666666666, "b": 292.0, "coord_origin": "1"}}, {"id": 95, "text": "row", "bbox": {"l": 241.33333333333334, "t": 285.0, "r": 256.0, "b": 290.0, "coord_origin": "1"}}, {"id": 96, "text": "has", "bbox": {"l": 259.0, "t": 283.0, "r": 271.6666666666667, "b": 290.0, "coord_origin": "1"}}, {"id": 97, "text": "the", "bbox": {"l": 274.3333333333333, "t": 283.0, "r": 286.0, "b": 290.0, "coord_origin": "1"}}, {"id": 98, "text": "same", "bbox": {"l": 50.333333333333336, "t": 297.0, "r": 70.0, "b": 302.0, "coord_origin": "1"}}, {"id": 99, "text": "number", "bbox": {"l": 73.66666666666667, "t": 295.0, "r": 103.66666666666667, "b": 302.0, "coord_origin": "1"}}, {"id": 100, "text": "of", "bbox": {"l": 106.66666666666667, "t": 295.0, "r": 115.33333333333333, "b": 302.0, "coord_origin": "1"}}, {"id": 101, "text": "columns", "bbox": {"l": 117.66666666666667, "t": 295.0, "r": 150.66666666666666, "b": 302.0, "coord_origin": "1"}}, {"id": 102, "text": "after", "bbox": {"l": 154.0, "t": 295.0, "r": 172.0, "b": 302.0, "coord_origin": "1"}}, {"id": 103, "text": "taking", "bbox": {"l": 175.0, "t": 295.0, "r": 199.33333333333334, "b": 304.0, "coord_origin": "1"}}, {"id": 104, "text": "into", "bbox": {"l": 202.66666666666666, "t": 295.0, "r": 217.66666666666666, "b": 302.0, "coord_origin": "1"}}, {"id": 105, "text": "account", "bbox": {"l": 220.66666666666666, "t": 296.3333333333333, "r": 251.0, "b": 302.0, "coord_origin": "1"}}, {"id": 106, "text": "any", "bbox": {"l": 254.33333333333334, "t": 297.0, "r": 268.0, "b": 304.0, "coord_origin": "1"}}, {"id": 107, "text": "row", "bbox": {"l": 271.3333333333333, "t": 297.0, "r": 286.0, "b": 302.0, "coord_origin": "1"}}, {"id": 108, "text": "or", "bbox": {"l": 50.333333333333336, "t": 309.0, "r": 58.333333333333336, "b": 314.0, "coord_origin": "1"}}, {"id": 109, "text": "column", "bbox": {"l": 61.333333333333336, "t": 307.0, "r": 90.66666666666667, "b": 314.0, "coord_origin": "1"}}, {"id": 110, "text": "spans.", "bbox": {"l": 94.66666666666667, "t": 309.0, "r": 118.0, "b": 316.0, "coord_origin": "1"}}, {"id": 111, "text": "Therefore", "bbox": {"l": 123.33333333333333, "t": 307.0, "r": 162.0, "b": 314.0, "coord_origin": "1"}}, {"id": 112, "text": "a", "bbox": {"l": 165.66666666666666, "t": 309.0, "r": 169.66666666666666, "b": 314.0, "coord_origin": "1"}}, {"id": 113, "text": "strict", "bbox": {"l": 173.33333333333334, "t": 307.0, "r": 192.33333333333334, "b": 314.0, "coord_origin": "1"}}, {"id": 114, "text": "HTML", "bbox": {"l": 196.0, "t": 307.0, "r": 223.66666666666666, "b": 314.0, "coord_origin": "1"}}, {"id": 115, "text": "structure", "bbox": {"l": 227.33333333333334, "t": 308.3333333333333, "r": 261.3333333333333, "b": 314.0, "coord_origin": "1"}}, {"id": 116, "text": "looks", "bbox": {"l": 265.0, "t": 307.0, "r": 286.0, "b": 314.0, "coord_origin": "1"}}, {"id": 117, "text": "always", "bbox": {"l": 50.333333333333336, "t": 319.0, "r": 77.33333333333333, "b": 328.0, "coord_origin": "1"}}, {"id": 118, "text": "rectangular.", "bbox": {"l": 80.66666666666667, "t": 319.0, "r": 126.33333333333333, "b": 328.0, "coord_origin": "1"}}, {"id": 119, "text": "However,", "bbox": {"l": 131.66666666666666, "t": 319.0, "r": 168.66666666666666, "b": 326.6666666666667, "coord_origin": "1"}}, {"id": 120, "text": "HTML", "bbox": {"l": 172.33333333333334, "t": 319.0, "r": 200.0, "b": 326.0, "coord_origin": "1"}}, {"id": 121, "text": "is", "bbox": {"l": 203.66666666666666, "t": 319.0, "r": 209.33333333333334, "b": 326.0, "coord_origin": "1"}}, {"id": 122, "text": "a", "bbox": {"l": 211.33333333333334, "t": 317.6666666666667, "r": 214.33333333333334, "b": 329.3333333333333, "coord_origin": "1"}}, {"id": 123, "text": "lenient", "bbox": {"l": 220.33333333333334, "t": 319.0, "r": 246.66666666666666, "b": 326.0, "coord_origin": "1"}}, {"id": 124, "text": "encoding", "bbox": {"l": 250.0, "t": 319.0, "r": 286.0, "b": 328.0, "coord_origin": "1"}}, {"id": 125, "text": "format,", "bbox": {"l": 50.666666666666664, "t": 331.0, "r": 78.66666666666667, "b": 338.6666666666667, "coord_origin": "1"}}, {"id": 126, "text": "i.e.", "bbox": {"l": 83.33333333333333, "t": 331.0, "r": 94.66666666666667, "b": 338.0, "coord_origin": "1"}}, {"id": 127, "text": "tables", "bbox": {"l": 101.66666666666667, "t": 331.0, "r": 124.33333333333333, "b": 338.0, "coord_origin": "1"}}, {"id": 128, "text": "with", "bbox": {"l": 128.66666666666666, "t": 331.0, "r": 145.66666666666666, "b": 338.0, "coord_origin": "1"}}, {"id": 129, "text": "rows", "bbox": {"l": 149.66666666666666, "t": 333.0, "r": 168.33333333333334, "b": 338.0, "coord_origin": "1"}}, {"id": 130, "text": "of", "bbox": {"l": 172.33333333333334, "t": 331.0, "r": 181.0, "b": 338.0, "coord_origin": "1"}}, {"id": 131, "text": "different", "bbox": {"l": 184.33333333333334, "t": 331.0, "r": 217.66666666666666, "b": 338.0, "coord_origin": "1"}}, {"id": 132, "text": "sizes", "bbox": {"l": 222.0, "t": 331.0, "r": 240.66666666666666, "b": 338.0, "coord_origin": "1"}}, {"id": 133, "text": "might", "bbox": {"l": 245.0, "t": 331.0, "r": 267.6666666666667, "b": 340.0, "coord_origin": "1"}}, {"id": 134, "text": "still", "bbox": {"l": 271.6666666666667, "t": 331.0, "r": 286.0, "b": 338.0, "coord_origin": "1"}}, {"id": 135, "text": "be", "bbox": {"l": 50.333333333333336, "t": 343.0, "r": 59.0, "b": 350.0, "coord_origin": "1"}}, {"id": 136, "text": "regarded", "bbox": {"l": 62.666666666666664, "t": 343.0, "r": 96.66666666666667, "b": 352.0, "coord_origin": "1"}}, {"id": 137, "text": "as", "bbox": {"l": 100.33333333333333, "t": 345.0, "r": 108.0, "b": 350.0, "coord_origin": "1"}}, {"id": 138, "text": "correct", "bbox": {"l": 111.66666666666667, "t": 344.3333333333333, "r": 138.66666666666666, "b": 350.0, "coord_origin": "1"}}, {"id": 139, "text": "due", "bbox": {"l": 142.33333333333334, "t": 343.0, "r": 156.0, "b": 350.0, "coord_origin": "1"}}, {"id": 140, "text": "to", "bbox": {"l": 159.66666666666666, "t": 344.3333333333333, "r": 167.0, "b": 350.0, "coord_origin": "1"}}, {"id": 141, "text": "implicit", "bbox": {"l": 170.66666666666666, "t": 343.0, "r": 201.0, "b": 352.0, "coord_origin": "1"}}, {"id": 142, "text": "display", "bbox": {"l": 204.33333333333334, "t": 343.0, "r": 232.33333333333334, "b": 352.0, "coord_origin": "1"}}, {"id": 143, "text": "rules.", "bbox": {"l": 236.33333333333334, "t": 343.0, "r": 257.3333333333333, "b": 350.0, "coord_origin": "1"}}, {"id": 144, "text": "These", "bbox": {"l": 262.6666666666667, "t": 343.0, "r": 286.0, "b": 350.0, "coord_origin": "1"}}, {"id": 145, "text": "implicit", "bbox": {"l": 50.333333333333336, "t": 355.0, "r": 80.66666666666667, "b": 364.0, "coord_origin": "1"}}, {"id": 146, "text": "rules", "bbox": {"l": 84.33333333333333, "t": 355.0, "r": 103.33333333333333, "b": 362.0, "coord_origin": "1"}}, {"id": 147, "text": "leave", "bbox": {"l": 107.0, "t": 355.0, "r": 126.66666666666667, "b": 362.0, "coord_origin": "1"}}, {"id": 148, "text": "room", "bbox": {"l": 130.33333333333334, "t": 357.0, "r": 151.0, "b": 362.0, "coord_origin": "1"}}, {"id": 149, "text": "for", "bbox": {"l": 154.66666666666666, "t": 355.0, "r": 165.66666666666666, "b": 362.0, "coord_origin": "1"}}, {"id": 150, "text": "ambiguity,", "bbox": {"l": 169.0, "t": 355.0, "r": 210.66666666666666, "b": 364.0, "coord_origin": "1"}}, {"id": 151, "text": "which", "bbox": {"l": 214.66666666666666, "t": 355.0, "r": 238.33333333333334, "b": 362.0, "coord_origin": "1"}}, {"id": 152, "text": "we", "bbox": {"l": 242.0, "t": 357.0, "r": 252.66666666666666, "b": 362.0, "coord_origin": "1"}}, {"id": 153, "text": "want", "bbox": {"l": 256.6666666666667, "t": 356.3333333333333, "r": 275.3333333333333, "b": 362.0, "coord_origin": "1"}}, {"id": 154, "text": "to", "bbox": {"l": 279.0, "t": 356.3333333333333, "r": 286.0, "b": 362.0, "coord_origin": "1"}}, {"id": 155, "text": "avoid.", "bbox": {"l": 50.333333333333336, "t": 367.0, "r": 73.66666666666667, "b": 374.0, "coord_origin": "1"}}, {"id": 156, "text": "As", "bbox": {"l": 78.0, "t": 367.0, "r": 88.66666666666667, "b": 374.0, "coord_origin": "1"}}, {"id": 157, "text": "such,", "bbox": {"l": 92.0, "t": 367.0, "r": 112.0, "b": 374.6666666666667, "coord_origin": "1"}}, {"id": 158, "text": "we", "bbox": {"l": 115.66666666666667, "t": 369.0, "r": 126.33333333333333, "b": 374.0, "coord_origin": "1"}}, {"id": 159, "text": "prefer", "bbox": {"l": 129.66666666666666, "t": 367.0, "r": 153.33333333333334, "b": 376.0, "coord_origin": "1"}}, {"id": 160, "text": "to", "bbox": {"l": 156.33333333333334, "t": 368.3333333333333, "r": 163.33333333333334, "b": 374.0, "coord_origin": "1"}}, {"id": 161, "text": "have", "bbox": {"l": 166.33333333333334, "t": 367.0, "r": 184.33333333333334, "b": 374.0, "coord_origin": "1"}}, {"id": 162, "text": "\u201cstrict\u201d", "bbox": {"l": 187.66666666666666, "t": 367.0, "r": 215.66666666666666, "b": 374.0, "coord_origin": "1"}}, {"id": 163, "text": "tables,", "bbox": {"l": 219.0, "t": 367.0, "r": 244.0, "b": 374.6666666666667, "coord_origin": "1"}}, {"id": 164, "text": "i.e.", "bbox": {"l": 247.66666666666666, "t": 367.0, "r": 258.6666666666667, "b": 374.0, "coord_origin": "1"}}, {"id": 165, "text": "tables", "bbox": {"l": 263.3333333333333, "t": 367.0, "r": 286.0, "b": 374.0, "coord_origin": "1"}}, {"id": 166, "text": "where", "bbox": {"l": 50.333333333333336, "t": 379.0, "r": 74.0, "b": 386.0, "coord_origin": "1"}}, {"id": 167, "text": "every", "bbox": {"l": 77.0, "t": 381.0, "r": 98.0, "b": 388.0, "coord_origin": "1"}}, {"id": 168, "text": "row", "bbox": {"l": 101.33333333333333, "t": 381.0, "r": 116.0, "b": 386.0, "coord_origin": "1"}}, {"id": 169, "text": "has", "bbox": {"l": 119.0, "t": 379.0, "r": 131.66666666666666, "b": 386.0, "coord_origin": "1"}}, {"id": 170, "text": "exactly", "bbox": {"l": 134.66666666666666, "t": 379.0, "r": 162.66666666666666, "b": 388.0, "coord_origin": "1"}}, {"id": 171, "text": "the", "bbox": {"l": 166.0, "t": 379.0, "r": 177.66666666666666, "b": 386.0, "coord_origin": "1"}}, {"id": 172, "text": "same", "bbox": {"l": 180.66666666666666, "t": 381.0, "r": 200.66666666666666, "b": 386.0, "coord_origin": "1"}}, {"id": 173, "text": "length.", "bbox": {"l": 203.66666666666666, "t": 379.0, "r": 230.0, "b": 388.0, "coord_origin": "1"}}, {"id": 174, "text": "We", "bbox": {"l": 62.333333333333336, "t": 391.0, "r": 74.66666666666667, "b": 398.0, "coord_origin": "1"}}, {"id": 175, "text": "have", "bbox": {"l": 80.0, "t": 391.0, "r": 97.66666666666667, "b": 398.0, "coord_origin": "1"}}, {"id": 176, "text": "developed", "bbox": {"l": 102.66666666666667, "t": 391.0, "r": 142.66666666666666, "b": 400.0, "coord_origin": "1"}}, {"id": 177, "text": "a", "bbox": {"l": 147.66666666666666, "t": 393.0, "r": 151.66666666666666, "b": 398.0, "coord_origin": "1"}}, {"id": 178, "text": "technique", "bbox": {"l": 156.66666666666666, "t": 391.0, "r": 194.66666666666666, "b": 400.0, "coord_origin": "1"}}, {"id": 179, "text": "that", "bbox": {"l": 200.0, "t": 391.0, "r": 214.33333333333334, "b": 398.0, "coord_origin": "1"}}, {"id": 180, "text": "tries", "bbox": {"l": 219.33333333333334, "t": 391.0, "r": 235.66666666666666, "b": 398.0, "coord_origin": "1"}}, {"id": 181, "text": "to", "bbox": {"l": 241.0, "t": 392.3333333333333, "r": 248.33333333333334, "b": 398.0, "coord_origin": "1"}}, {"id": 182, "text": "derive", "bbox": {"l": 253.0, "t": 391.0, "r": 277.0, "b": 398.0, "coord_origin": "1"}}, {"id": 183, "text": "a", "bbox": {"l": 282.3333333333333, "t": 393.0, "r": 286.3333333333333, "b": 398.0, "coord_origin": "1"}}, {"id": 184, "text": "missing", "bbox": {"l": 50.333333333333336, "t": 403.0, "r": 80.66666666666667, "b": 412.0, "coord_origin": "1"}}, {"id": 185, "text": "bounding", "bbox": {"l": 84.33333333333333, "t": 403.0, "r": 121.33333333333333, "b": 412.0, "coord_origin": "1"}}, {"id": 186, "text": "box", "bbox": {"l": 125.0, "t": 403.0, "r": 139.0, "b": 410.0, "coord_origin": "1"}}, {"id": 187, "text": "out", "bbox": {"l": 142.66666666666666, "t": 404.3333333333333, "r": 155.0, "b": 410.0, "coord_origin": "1"}}, {"id": 188, "text": "of", "bbox": {"l": 158.33333333333334, "t": 403.0, "r": 167.0, "b": 410.0, "coord_origin": "1"}}, {"id": 189, "text": "its", "bbox": {"l": 169.66666666666666, "t": 403.0, "r": 178.66666666666666, "b": 410.0, "coord_origin": "1"}}, {"id": 190, "text": "neighbors.", "bbox": {"l": 182.0, "t": 403.0, "r": 222.66666666666666, "b": 412.0, "coord_origin": "1"}}, {"id": 191, "text": "As", "bbox": {"l": 228.33333333333334, "t": 403.0, "r": 238.66666666666666, "b": 410.0, "coord_origin": "1"}}, {"id": 192, "text": "a", "bbox": {"l": 239.33333333333334, "t": 401.6666666666667, "r": 243.66666666666666, "b": 413.3333333333333, "coord_origin": "1"}}, {"id": 193, "text": "first", "bbox": {"l": 250.0, "t": 403.0, "r": 264.6666666666667, "b": 410.0, "coord_origin": "1"}}, {"id": 194, "text": "step,", "bbox": {"l": 268.3333333333333, "t": 404.3333333333333, "r": 285.6666666666667, "b": 412.0, "coord_origin": "1"}}, {"id": 195, "text": "we", "bbox": {"l": 50.333333333333336, "t": 417.0, "r": 61.333333333333336, "b": 422.0, "coord_origin": "1"}}, {"id": 196, "text": "use", "bbox": {"l": 64.33333333333333, "t": 417.0, "r": 76.66666666666667, "b": 422.0, "coord_origin": "1"}}, {"id": 197, "text": "the", "bbox": {"l": 79.66666666666667, "t": 415.0, "r": 91.0, "b": 422.0, "coord_origin": "1"}}, {"id": 198, "text": "annotation", "bbox": {"l": 94.0, "t": 415.0, "r": 135.33333333333334, "b": 422.0, "coord_origin": "1"}}, {"id": 199, "text": "data", "bbox": {"l": 138.0, "t": 415.0, "r": 154.33333333333334, "b": 422.0, "coord_origin": "1"}}, {"id": 200, "text": "to", "bbox": {"l": 156.66666666666666, "t": 416.3333333333333, "r": 164.0, "b": 422.0, "coord_origin": "1"}}, {"id": 201, "text": "generate", "bbox": {"l": 166.66666666666666, "t": 416.3333333333333, "r": 199.66666666666666, "b": 424.0, "coord_origin": "1"}}, {"id": 202, "text": "the", "bbox": {"l": 202.66666666666666, "t": 415.0, "r": 214.0, "b": 422.0, "coord_origin": "1"}}, {"id": 203, "text": "most", "bbox": {"l": 217.0, "t": 416.3333333333333, "r": 235.66666666666666, "b": 422.0, "coord_origin": "1"}}, {"id": 204, "text": "fine-grained", "bbox": {"l": 238.66666666666666, "t": 415.0, "r": 286.0, "b": 424.0, "coord_origin": "1"}}, {"id": 205, "text": "grid", "bbox": {"l": 50.333333333333336, "t": 427.0, "r": 65.66666666666667, "b": 436.0, "coord_origin": "1"}}, {"id": 206, "text": "that", "bbox": {"l": 69.33333333333333, "t": 427.0, "r": 83.33333333333333, "b": 434.0, "coord_origin": "1"}}, {"id": 207, "text": "covers", "bbox": {"l": 86.66666666666667, "t": 429.0, "r": 112.0, "b": 434.0, "coord_origin": "1"}}, {"id": 208, "text": "the", "bbox": {"l": 115.33333333333333, "t": 427.0, "r": 126.66666666666667, "b": 434.0, "coord_origin": "1"}}, {"id": 209, "text": "table", "bbox": {"l": 130.33333333333334, "t": 427.0, "r": 149.0, "b": 434.0, "coord_origin": "1"}}, {"id": 210, "text": "structure.", "bbox": {"l": 152.66666666666666, "t": 428.3333333333333, "r": 188.66666666666666, "b": 434.0, "coord_origin": "1"}}, {"id": 211, "text": "In", "bbox": {"l": 193.66666666666666, "t": 427.0, "r": 201.33333333333334, "b": 434.0, "coord_origin": "1"}}, {"id": 212, "text": "case", "bbox": {"l": 204.66666666666666, "t": 429.0, "r": 221.33333333333334, "b": 434.0, "coord_origin": "1"}}, {"id": 213, "text": "of", "bbox": {"l": 224.66666666666666, "t": 427.0, "r": 233.0, "b": 434.0, "coord_origin": "1"}}, {"id": 214, "text": "strict", "bbox": {"l": 235.66666666666666, "t": 427.0, "r": 255.0, "b": 434.0, "coord_origin": "1"}}, {"id": 215, "text": "HTML", "bbox": {"l": 258.3333333333333, "t": 427.0, "r": 286.0, "b": 434.0, "coord_origin": "1"}}, {"id": 216, "text": "tables,", "bbox": {"l": 50.333333333333336, "t": 439.0, "r": 75.33333333333333, "b": 446.6666666666667, "coord_origin": "1"}}, {"id": 217, "text": "all", "bbox": {"l": 79.66666666666667, "t": 439.0, "r": 88.66666666666667, "b": 446.0, "coord_origin": "1"}}, {"id": 218, "text": "grid", "bbox": {"l": 92.66666666666667, "t": 439.0, "r": 108.0, "b": 448.0, "coord_origin": "1"}}, {"id": 219, "text": "squares", "bbox": {"l": 112.0, "t": 441.0, "r": 141.33333333333334, "b": 448.0, "coord_origin": "1"}}, {"id": 220, "text": "are", "bbox": {"l": 145.0, "t": 441.0, "r": 156.33333333333334, "b": 446.0, "coord_origin": "1"}}, {"id": 221, "text": "associated", "bbox": {"l": 160.33333333333334, "t": 439.0, "r": 200.66666666666666, "b": 446.0, "coord_origin": "1"}}, {"id": 222, "text": "with", "bbox": {"l": 204.66666666666666, "t": 439.0, "r": 221.66666666666666, "b": 446.0, "coord_origin": "1"}}, {"id": 223, "text": "some", "bbox": {"l": 225.66666666666666, "t": 441.0, "r": 245.66666666666666, "b": 446.0, "coord_origin": "1"}}, {"id": 224, "text": "table", "bbox": {"l": 249.66666666666666, "t": 439.0, "r": 268.3333333333333, "b": 446.0, "coord_origin": "1"}}, {"id": 225, "text": "cell", "bbox": {"l": 272.0, "t": 439.0, "r": 286.0, "b": 446.0, "coord_origin": "1"}}, {"id": 226, "text": "and", "bbox": {"l": 50.333333333333336, "t": 451.0, "r": 64.0, "b": 458.0, "coord_origin": "1"}}, {"id": 227, "text": "in", "bbox": {"l": 67.0, "t": 451.0, "r": 74.0, "b": 458.0, "coord_origin": "1"}}, {"id": 228, "text": "the", "bbox": {"l": 77.0, "t": 451.0, "r": 88.33333333333333, "b": 458.0, "coord_origin": "1"}}, {"id": 229, "text": "presence", "bbox": {"l": 91.33333333333333, "t": 453.0, "r": 125.33333333333333, "b": 460.0, "coord_origin": "1"}}, {"id": 230, "text": "of", "bbox": {"l": 128.33333333333334, "t": 451.0, "r": 137.0, "b": 458.0, "coord_origin": "1"}}, {"id": 231, "text": "table", "bbox": {"l": 139.0, "t": 451.0, "r": 157.66666666666666, "b": 458.0, "coord_origin": "1"}}, {"id": 232, "text": "spans", "bbox": {"l": 160.66666666666666, "t": 453.0, "r": 182.0, "b": 460.3333333333333, "coord_origin": "1"}}, {"id": 233, "text": "a", "bbox": {"l": 184.66666666666666, "t": 453.0, "r": 189.0, "b": 458.0, "coord_origin": "1"}}, {"id": 234, "text": "cell", "bbox": {"l": 191.33333333333334, "t": 451.0, "r": 205.0, "b": 458.0, "coord_origin": "1"}}, {"id": 235, "text": "extends", "bbox": {"l": 208.0, "t": 451.0, "r": 237.66666666666666, "b": 458.0, "coord_origin": "1"}}, {"id": 236, "text": "across", "bbox": {"l": 240.66666666666666, "t": 453.0, "r": 265.0, "b": 458.0, "coord_origin": "1"}}, {"id": 237, "text": "mul-", "bbox": {"l": 268.0, "t": 451.0, "r": 286.0, "b": 458.0, "coord_origin": "1"}}, {"id": 238, "text": "tiple", "bbox": {"l": 50.333333333333336, "t": 462.6666666666667, "r": 67.33333333333333, "b": 471.6666666666667, "coord_origin": "1"}}, {"id": 239, "text": "grid", "bbox": {"l": 70.0, "t": 462.6666666666667, "r": 85.33333333333333, "b": 471.6666666666667, "coord_origin": "1"}}, {"id": 240, "text": "squares.", "bbox": {"l": 88.33333333333333, "t": 464.6666666666667, "r": 119.66666666666667, "b": 471.6666666666667, "coord_origin": "1"}}, {"id": 241, "text": "When", "bbox": {"l": 123.33333333333333, "t": 462.6666666666667, "r": 146.66666666666666, "b": 469.3333333333333, "coord_origin": "1"}}, {"id": 242, "text": "enough", "bbox": {"l": 149.33333333333334, "t": 462.6666666666667, "r": 178.0, "b": 471.6666666666667, "coord_origin": "1"}}, {"id": 243, "text": "bounding", "bbox": {"l": 180.66666666666666, "t": 462.6666666666667, "r": 217.66666666666666, "b": 471.6666666666667, "coord_origin": "1"}}, {"id": 244, "text": "boxes", "bbox": {"l": 220.33333333333334, "t": 462.6666666666667, "r": 243.0, "b": 469.3333333333333, "coord_origin": "1"}}, {"id": 245, "text": "are", "bbox": {"l": 245.66666666666666, "t": 464.6666666666667, "r": 257.0, "b": 469.3333333333333, "coord_origin": "1"}}, {"id": 246, "text": "known", "bbox": {"l": 259.6666666666667, "t": 462.6666666666667, "r": 286.0, "b": 469.3333333333333, "coord_origin": "1"}}, {"id": 247, "text": "for", "bbox": {"l": 50.666666666666664, "t": 474.6666666666667, "r": 61.666666666666664, "b": 481.3333333333333, "coord_origin": "1"}}, {"id": 248, "text": "a", "bbox": {"l": 65.66666666666667, "t": 476.6666666666667, "r": 69.66666666666667, "b": 481.3333333333333, "coord_origin": "1"}}, {"id": 249, "text": "rectangular", "bbox": {"l": 73.66666666666667, "t": 474.6666666666667, "r": 118.33333333333333, "b": 483.6666666666667, "coord_origin": "1"}}, {"id": 250, "text": "table,", "bbox": {"l": 122.0, "t": 474.6666666666667, "r": 143.33333333333334, "b": 482.3333333333333, "coord_origin": "1"}}, {"id": 251, "text": "it", "bbox": {"l": 148.0, "t": 474.6666666666667, "r": 152.66666666666666, "b": 481.3333333333333, "coord_origin": "1"}}, {"id": 252, "text": "is", "bbox": {"l": 157.33333333333334, "t": 474.6666666666667, "r": 163.33333333333334, "b": 481.3333333333333, "coord_origin": "1"}}, {"id": 253, "text": "possible", "bbox": {"l": 167.33333333333334, "t": 474.6666666666667, "r": 199.33333333333334, "b": 483.6666666666667, "coord_origin": "1"}}, {"id": 254, "text": "to", "bbox": {"l": 203.66666666666666, "t": 475.6666666666667, "r": 211.0, "b": 481.3333333333333, "coord_origin": "1"}}, {"id": 255, "text": "compute", "bbox": {"l": 215.0, "t": 475.6666666666667, "r": 248.66666666666666, "b": 483.6666666666667, "coord_origin": "1"}}, {"id": 256, "text": "the", "bbox": {"l": 253.33333333333334, "t": 474.6666666666667, "r": 264.6666666666667, "b": 481.3333333333333, "coord_origin": "1"}}, {"id": 257, "text": "geo-", "bbox": {"l": 268.6666666666667, "t": 476.6666666666667, "r": 286.0, "b": 483.6666666666667, "coord_origin": "1"}}, {"id": 258, "text": "metrical", "bbox": {"l": 50.333333333333336, "t": 486.6666666666667, "r": 82.33333333333333, "b": 493.6666666666667, "coord_origin": "1"}}, {"id": 259, "text": "border", "bbox": {"l": 86.33333333333333, "t": 486.6666666666667, "r": 112.33333333333333, "b": 493.3333333333333, "coord_origin": "1"}}, {"id": 260, "text": "lines", "bbox": {"l": 116.0, "t": 486.6666666666667, "r": 134.0, "b": 493.3333333333333, "coord_origin": "1"}}, {"id": 261, "text": "between", "bbox": {"l": 138.0, "t": 486.6666666666667, "r": 170.66666666666666, "b": 493.3333333333333, "coord_origin": "1"}}, {"id": 262, "text": "the", "bbox": {"l": 174.66666666666666, "t": 486.6666666666667, "r": 186.33333333333334, "b": 493.3333333333333, "coord_origin": "1"}}, {"id": 263, "text": "grid", "bbox": {"l": 190.33333333333334, "t": 486.6666666666667, "r": 206.0, "b": 495.6666666666667, "coord_origin": "1"}}, {"id": 264, "text": "rows", "bbox": {"l": 210.0, "t": 488.6666666666667, "r": 228.33333333333334, "b": 493.3333333333333, "coord_origin": "1"}}, {"id": 265, "text": "and", "bbox": {"l": 232.33333333333334, "t": 486.6666666666667, "r": 246.33333333333334, "b": 493.3333333333333, "coord_origin": "1"}}, {"id": 266, "text": "columns.", "bbox": {"l": 250.33333333333334, "t": 486.6666666666667, "r": 285.6666666666667, "b": 493.6666666666667, "coord_origin": "1"}}, {"id": 267, "text": "Eventually", "bbox": {"l": 50.333333333333336, "t": 498.6666666666667, "r": 92.66666666666667, "b": 507.6666666666667, "coord_origin": "1"}}, {"id": 268, "text": "this", "bbox": {"l": 96.33333333333333, "t": 498.6666666666667, "r": 110.0, "b": 505.3333333333333, "coord_origin": "1"}}, {"id": 269, "text": "information", "bbox": {"l": 113.33333333333333, "t": 498.6666666666667, "r": 159.66666666666666, "b": 505.3333333333333, "coord_origin": "1"}}, {"id": 270, "text": "is", "bbox": {"l": 163.33333333333334, "t": 498.6666666666667, "r": 169.0, "b": 505.3333333333333, "coord_origin": "1"}}, {"id": 271, "text": "used", "bbox": {"l": 172.66666666666666, "t": 498.6666666666667, "r": 190.0, "b": 505.6666666666667, "coord_origin": "1"}}, {"id": 272, "text": "to", "bbox": {"l": 193.66666666666666, "t": 499.6666666666667, "r": 200.66666666666666, "b": 505.3333333333333, "coord_origin": "1"}}, {"id": 273, "text": "generate", "bbox": {"l": 204.0, "t": 500.0, "r": 237.33333333333334, "b": 507.6666666666667, "coord_origin": "1"}}, {"id": 274, "text": "the", "bbox": {"l": 240.66666666666666, "t": 498.6666666666667, "r": 252.0, "b": 505.6666666666667, "coord_origin": "1"}}, {"id": 275, "text": "missing", "bbox": {"l": 255.66666666666666, "t": 498.6666666666667, "r": 286.0, "b": 507.6666666666667, "coord_origin": "1"}}, {"id": 276, "text": "bounding", "bbox": {"l": 50.333333333333336, "t": 510.6666666666667, "r": 87.33333333333333, "b": 519.6666666666666, "coord_origin": "1"}}, {"id": 277, "text": "boxes.", "bbox": {"l": 90.66666666666667, "t": 510.6666666666667, "r": 115.33333333333333, "b": 517.6666666666666, "coord_origin": "1"}}, {"id": 278, "text": "Additionally,", "bbox": {"l": 119.66666666666667, "t": 510.6666666666667, "r": 171.0, "b": 519.6666666666666, "coord_origin": "1"}}, {"id": 279, "text": "the", "bbox": {"l": 174.66666666666666, "t": 510.6666666666667, "r": 186.0, "b": 517.6666666666666, "coord_origin": "1"}}, {"id": 280, "text": "existence", "bbox": {"l": 189.0, "t": 510.6666666666667, "r": 225.66666666666666, "b": 517.6666666666666, "coord_origin": "1"}}, {"id": 281, "text": "of", "bbox": {"l": 228.66666666666666, "t": 510.6666666666667, "r": 237.33333333333334, "b": 517.3333333333334, "coord_origin": "1"}}, {"id": 282, "text": "unused", "bbox": {"l": 240.0, "t": 510.6666666666667, "r": 267.3333333333333, "b": 517.6666666666666, "coord_origin": "1"}}, {"id": 283, "text": "grid", "bbox": {"l": 270.3333333333333, "t": 510.6666666666667, "r": 286.0, "b": 519.6666666666666, "coord_origin": "1"}}, {"id": 284, "text": "squares", "bbox": {"l": 50.333333333333336, "t": 524.6666666666666, "r": 79.66666666666667, "b": 531.6666666666666, "coord_origin": "1"}}, {"id": 285, "text": "indicates", "bbox": {"l": 83.33333333333333, "t": 522.6666666666666, "r": 118.0, "b": 529.6666666666666, "coord_origin": "1"}}, {"id": 286, "text": "that", "bbox": {"l": 122.0, "t": 522.6666666666666, "r": 136.33333333333334, "b": 529.6666666666666, "coord_origin": "1"}}, {"id": 287, "text": "the", "bbox": {"l": 140.0, "t": 522.6666666666666, "r": 151.33333333333334, "b": 529.6666666666666, "coord_origin": "1"}}, {"id": 288, "text": "table", "bbox": {"l": 155.33333333333334, "t": 522.6666666666666, "r": 174.0, "b": 529.6666666666666, "coord_origin": "1"}}, {"id": 289, "text": "rows", "bbox": {"l": 177.66666666666666, "t": 524.6666666666666, "r": 196.0, "b": 529.3333333333334, "coord_origin": "1"}}, {"id": 290, "text": "have", "bbox": {"l": 200.0, "t": 522.6666666666666, "r": 217.66666666666666, "b": 529.6666666666666, "coord_origin": "1"}}, {"id": 291, "text": "unequal", "bbox": {"l": 221.66666666666666, "t": 522.6666666666666, "r": 252.33333333333334, "b": 531.6666666666666, "coord_origin": "1"}}, {"id": 292, "text": "number", "bbox": {"l": 256.3333333333333, "t": 522.6666666666666, "r": 286.3333333333333, "b": 529.6666666666666, "coord_origin": "1"}}, {"id": 293, "text": "of", "bbox": {"l": 50.333333333333336, "t": 534.6666666666666, "r": 59.0, "b": 541.3333333333334, "coord_origin": "1"}}, {"id": 294, "text": "columns", "bbox": {"l": 61.0, "t": 534.6666666666666, "r": 94.33333333333333, "b": 541.6666666666666, "coord_origin": "1"}}, {"id": 295, "text": "and", "bbox": {"l": 97.66666666666667, "t": 534.6666666666666, "r": 111.33333333333333, "b": 541.6666666666666, "coord_origin": "1"}}, {"id": 296, "text": "the", "bbox": {"l": 114.66666666666667, "t": 534.6666666666666, "r": 126.33333333333333, "b": 541.6666666666666, "coord_origin": "1"}}, {"id": 297, "text": "overall", "bbox": {"l": 129.66666666666666, "t": 534.6666666666666, "r": 156.33333333333334, "b": 541.6666666666666, "coord_origin": "1"}}, {"id": 298, "text": "structure", "bbox": {"l": 159.66666666666666, "t": 536.0, "r": 193.66666666666666, "b": 541.6666666666666, "coord_origin": "1"}}, {"id": 299, "text": "is", "bbox": {"l": 197.33333333333334, "t": 534.6666666666666, "r": 203.33333333333334, "b": 541.3333333333334, "coord_origin": "1"}}, {"id": 300, "text": "non-strict.", "bbox": {"l": 206.66666666666666, "t": 534.6666666666666, "r": 246.0, "b": 541.6666666666666, "coord_origin": "1"}}, {"id": 301, "text": "The", "bbox": {"l": 250.66666666666666, "t": 534.6666666666666, "r": 265.6666666666667, "b": 541.6666666666666, "coord_origin": "1"}}, {"id": 302, "text": "gen-", "bbox": {"l": 268.6666666666667, "t": 536.6666666666666, "r": 286.0, "b": 543.6666666666666, "coord_origin": "1"}}, {"id": 303, "text": "eration", "bbox": {"l": 50.333333333333336, "t": 546.6666666666666, "r": 77.33333333333333, "b": 553.6666666666666, "coord_origin": "1"}}, {"id": 304, "text": "of", "bbox": {"l": 80.33333333333333, "t": 546.6666666666666, "r": 89.0, "b": 553.3333333333334, "coord_origin": "1"}}, {"id": 305, "text": "missing", "bbox": {"l": 91.33333333333333, "t": 546.6666666666666, "r": 121.66666666666667, "b": 555.6666666666666, "coord_origin": "1"}}, {"id": 306, "text": "bounding", "bbox": {"l": 125.0, "t": 546.6666666666666, "r": 162.0, "b": 555.6666666666666, "coord_origin": "1"}}, {"id": 307, "text": "boxes", "bbox": {"l": 165.0, "t": 546.6666666666666, "r": 187.33333333333334, "b": 553.6666666666666, "coord_origin": "1"}}, {"id": 308, "text": "for", "bbox": {"l": 190.66666666666666, "t": 546.6666666666666, "r": 202.0, "b": 553.3333333333334, "coord_origin": "1"}}, {"id": 309, "text": "non-strict", "bbox": {"l": 204.66666666666666, "t": 546.6666666666666, "r": 242.33333333333334, "b": 553.6666666666666, "coord_origin": "1"}}, {"id": 310, "text": "HTML", "bbox": {"l": 245.33333333333334, "t": 546.6666666666666, "r": 273.0, "b": 553.3333333333334, "coord_origin": "1"}}, {"id": 311, "text": "ta-", "bbox": {"l": 276.0, "t": 547.6666666666666, "r": 286.0, "b": 553.6666666666666, "coord_origin": "1"}}, {"id": 312, "text": "bles", "bbox": {"l": 50.333333333333336, "t": 558.6666666666666, "r": 65.66666666666667, "b": 565.6666666666666, "coord_origin": "1"}}, {"id": 313, "text": "is", "bbox": {"l": 70.0, "t": 558.6666666666666, "r": 76.0, "b": 565.3333333333334, "coord_origin": "1"}}, {"id": 314, "text": "ambiguous", "bbox": {"l": 80.0, "t": 558.6666666666666, "r": 123.33333333333333, "b": 567.6666666666666, "coord_origin": "1"}}, {"id": 315, "text": "and", "bbox": {"l": 127.66666666666667, "t": 558.6666666666666, "r": 141.33333333333334, "b": 565.6666666666666, "coord_origin": "1"}}, {"id": 316, "text": "therefore", "bbox": {"l": 145.66666666666666, "t": 558.6666666666666, "r": 181.0, "b": 565.6666666666666, "coord_origin": "1"}}, {"id": 317, "text": "quite", "bbox": {"l": 185.0, "t": 558.6666666666666, "r": 204.33333333333334, "b": 567.6666666666666, "coord_origin": "1"}}, {"id": 318, "text": "challenging.", "bbox": {"l": 208.66666666666666, "t": 558.6666666666666, "r": 256.6666666666667, "b": 567.6666666666666, "coord_origin": "1"}}, {"id": 319, "text": "Thus,", "bbox": {"l": 264.0, "t": 558.6666666666666, "r": 285.6666666666667, "b": 566.6666666666666, "coord_origin": "1"}}, {"id": 320, "text": "we", "bbox": {"l": 50.333333333333336, "t": 572.6666666666666, "r": 61.333333333333336, "b": 577.6666666666666, "coord_origin": "1"}}, {"id": 321, "text": "have", "bbox": {"l": 65.0, "t": 570.6666666666666, "r": 82.66666666666667, "b": 577.6666666666666, "coord_origin": "1"}}, {"id": 322, "text": "decided", "bbox": {"l": 86.33333333333333, "t": 570.6666666666666, "r": 116.66666666666667, "b": 577.6666666666666, "coord_origin": "1"}}, {"id": 323, "text": "to", "bbox": {"l": 120.33333333333333, "t": 572.0, "r": 127.66666666666667, "b": 577.6666666666666, "coord_origin": "1"}}, {"id": 324, "text": "simply", "bbox": {"l": 131.0, "t": 570.6666666666666, "r": 157.33333333333334, "b": 579.6666666666666, "coord_origin": "1"}}, {"id": 325, "text": "discard", "bbox": {"l": 161.0, "t": 570.6666666666666, "r": 189.33333333333334, "b": 577.6666666666666, "coord_origin": "1"}}, {"id": 326, "text": "those", "bbox": {"l": 192.66666666666666, "t": 570.6666666666666, "r": 213.0, "b": 577.6666666666666, "coord_origin": "1"}}, {"id": 327, "text": "tables.", "bbox": {"l": 216.66666666666666, "t": 570.6666666666666, "r": 241.66666666666666, "b": 577.6666666666666, "coord_origin": "1"}}, {"id": 328, "text": "In", "bbox": {"l": 247.0, "t": 570.6666666666666, "r": 254.66666666666666, "b": 577.3333333333334, "coord_origin": "1"}}, {"id": 329, "text": "case", "bbox": {"l": 258.0, "t": 572.6666666666666, "r": 274.6666666666667, "b": 577.6666666666666, "coord_origin": "1"}}, {"id": 330, "text": "of", "bbox": {"l": 278.3333333333333, "t": 570.6666666666666, "r": 286.6666666666667, "b": 577.3333333333334, "coord_origin": "1"}}, {"id": 331, "text": "PubTabNet", "bbox": {"l": 50.333333333333336, "t": 582.6666666666666, "r": 94.33333333333333, "b": 589.6666666666666, "coord_origin": "1"}}, {"id": 332, "text": "we", "bbox": {"l": 97.66666666666667, "t": 584.6666666666666, "r": 108.66666666666667, "b": 589.6666666666666, "coord_origin": "1"}}, {"id": 333, "text": "have", "bbox": {"l": 112.0, "t": 582.6666666666666, "r": 129.66666666666666, "b": 589.6666666666666, "coord_origin": "1"}}, {"id": 334, "text": "computed", "bbox": {"l": 133.0, "t": 582.6666666666666, "r": 171.66666666666666, "b": 591.6666666666666, "coord_origin": "1"}}, {"id": 335, "text": "missing", "bbox": {"l": 175.33333333333334, "t": 582.6666666666666, "r": 205.66666666666666, "b": 591.6666666666666, "coord_origin": "1"}}, {"id": 336, "text": "bounding", "bbox": {"l": 209.0, "t": 582.6666666666666, "r": 245.66666666666666, "b": 591.6666666666666, "coord_origin": "1"}}, {"id": 337, "text": "boxes", "bbox": {"l": 249.33333333333334, "t": 582.6666666666666, "r": 271.6666666666667, "b": 589.6666666666666, "coord_origin": "1"}}, {"id": 338, "text": "for", "bbox": {"l": 275.3333333333333, "t": 582.6666666666666, "r": 286.3333333333333, "b": 589.3333333333334, "coord_origin": "1"}}, {"id": 339, "text": "48%", "bbox": {"l": 50.0, "t": 594.0, "r": 67.66666666666667, "b": 601.0, "coord_origin": "1"}}, {"id": 340, "text": "of", "bbox": {"l": 71.0, "t": 594.0, "r": 79.66666666666667, "b": 601.0, "coord_origin": "1"}}, {"id": 341, "text": "the", "bbox": {"l": 82.0, "t": 594.0, "r": 93.33333333333333, "b": 601.0, "coord_origin": "1"}}, {"id": 342, "text": "simple", "bbox": {"l": 96.66666666666667, "t": 594.0, "r": 122.66666666666667, "b": 603.3333333333334, "coord_origin": "1"}}, {"id": 343, "text": "and", "bbox": {"l": 125.66666666666667, "t": 594.0, "r": 139.33333333333334, "b": 601.0, "coord_origin": "1"}}, {"id": 344, "text": "69%", "bbox": {"l": 142.66666666666666, "t": 594.3333333333334, "r": 160.33333333333334, "b": 601.0, "coord_origin": "1"}}, {"id": 345, "text": "of", "bbox": {"l": 163.33333333333334, "t": 594.0, "r": 172.0, "b": 601.0, "coord_origin": "1"}}, {"id": 346, "text": "the", "bbox": {"l": 174.33333333333334, "t": 594.0, "r": 185.66666666666666, "b": 601.0, "coord_origin": "1"}}, {"id": 347, "text": "complex", "bbox": {"l": 189.0, "t": 594.0, "r": 222.33333333333334, "b": 603.3333333333334, "coord_origin": "1"}}, {"id": 348, "text": "tables.", "bbox": {"l": 225.66666666666666, "t": 594.0, "r": 250.33333333333334, "b": 601.0, "coord_origin": "1"}}, {"id": 349, "text": "Regard-", "bbox": {"l": 254.66666666666666, "t": 594.0, "r": 286.0, "b": 603.3333333333334, "coord_origin": "1"}}, {"id": 350, "text": "ing", "bbox": {"l": 50.333333333333336, "t": 606.0, "r": 62.666666666666664, "b": 615.3333333333334, "coord_origin": "1"}}, {"id": 351, "text": "FinTabNet,", "bbox": {"l": 65.66666666666667, "t": 606.0, "r": 109.66666666666667, "b": 614.0, "coord_origin": "1"}}, {"id": 352, "text": "68%", "bbox": {"l": 113.33333333333333, "t": 606.0, "r": 130.66666666666666, "b": 613.0, "coord_origin": "1"}}, {"id": 353, "text": "of", "bbox": {"l": 134.0, "t": 606.0, "r": 142.66666666666666, "b": 613.0, "coord_origin": "1"}}, {"id": 354, "text": "the", "bbox": {"l": 145.0, "t": 606.0, "r": 156.33333333333334, "b": 613.0, "coord_origin": "1"}}, {"id": 355, "text": "simple", "bbox": {"l": 159.66666666666666, "t": 606.0, "r": 185.66666666666666, "b": 615.3333333333334, "coord_origin": "1"}}, {"id": 356, "text": "and", "bbox": {"l": 189.0, "t": 606.0, "r": 202.66666666666666, "b": 613.0, "coord_origin": "1"}}, {"id": 357, "text": "98%", "bbox": {"l": 205.66666666666666, "t": 606.0, "r": 223.33333333333334, "b": 613.0, "coord_origin": "1"}}, {"id": 358, "text": "of", "bbox": {"l": 226.66666666666666, "t": 606.0, "r": 235.33333333333334, "b": 613.0, "coord_origin": "1"}}, {"id": 359, "text": "the", "bbox": {"l": 237.66666666666666, "t": 606.0, "r": 249.33333333333334, "b": 613.0, "coord_origin": "1"}}, {"id": 360, "text": "complex", "bbox": {"l": 252.33333333333334, "t": 606.0, "r": 285.6666666666667, "b": 615.3333333333334, "coord_origin": "1"}}, {"id": 361, "text": "tables", "bbox": {"l": 50.333333333333336, "t": 618.0, "r": 73.0, "b": 625.0, "coord_origin": "1"}}, {"id": 362, "text": "require", "bbox": {"l": 76.0, "t": 618.0, "r": 103.66666666666667, "b": 627.3333333333334, "coord_origin": "1"}}, {"id": 363, "text": "the", "bbox": {"l": 106.66666666666667, "t": 618.0, "r": 118.33333333333333, "b": 625.0, "coord_origin": "1"}}, {"id": 364, "text": "generation", "bbox": {"l": 121.33333333333333, "t": 618.0, "r": 163.0, "b": 627.3333333333334, "coord_origin": "1"}}, {"id": 365, "text": "of", "bbox": {"l": 166.0, "t": 618.0, "r": 174.33333333333334, "b": 625.0, "coord_origin": "1"}}, {"id": 366, "text": "bounding", "bbox": {"l": 176.66666666666666, "t": 618.0, "r": 214.0, "b": 627.3333333333334, "coord_origin": "1"}}, {"id": 367, "text": "boxes.", "bbox": {"l": 217.0, "t": 618.0, "r": 241.66666666666666, "b": 625.0, "coord_origin": "1"}}, {"id": 368, "text": "Figure", "bbox": {"l": 62.333333333333336, "t": 630.6666666666666, "r": 87.66666666666667, "b": 639.6666666666666, "coord_origin": "1"}}, {"id": 369, "text": "7", "bbox": {"l": 91.66666666666667, "t": 630.6666666666666, "r": 96.0, "b": 637.3333333333334, "coord_origin": "1"}}, {"id": 370, "text": "illustrates", "bbox": {"l": 100.33333333333333, "t": 630.6666666666666, "r": 138.33333333333334, "b": 637.6666666666666, "coord_origin": "1"}}, {"id": 371, "text": "the", "bbox": {"l": 142.66666666666666, "t": 630.6666666666666, "r": 154.0, "b": 637.6666666666666, "coord_origin": "1"}}, {"id": 372, "text": "distribution", "bbox": {"l": 158.0, "t": 630.6666666666666, "r": 203.33333333333334, "b": 637.6666666666666, "coord_origin": "1"}}, {"id": 373, "text": "of", "bbox": {"l": 207.33333333333334, "t": 630.6666666666666, "r": 216.0, "b": 637.3333333333334, "coord_origin": "1"}}, {"id": 374, "text": "the", "bbox": {"l": 219.33333333333334, "t": 630.6666666666666, "r": 230.66666666666666, "b": 637.6666666666666, "coord_origin": "1"}}, {"id": 375, "text": "tables", "bbox": {"l": 235.0, "t": 630.6666666666666, "r": 257.6666666666667, "b": 637.6666666666666, "coord_origin": "1"}}, {"id": 376, "text": "across", "bbox": {"l": 261.6666666666667, "t": 632.6666666666666, "r": 286.0, "b": 637.6666666666666, "coord_origin": "1"}}, {"id": 377, "text": "different", "bbox": {"l": 50.333333333333336, "t": 642.0, "r": 83.66666666666667, "b": 649.0, "coord_origin": "1"}}, {"id": 378, "text": "dimensions", "bbox": {"l": 86.66666666666667, "t": 642.0, "r": 131.66666666666666, "b": 649.0, "coord_origin": "1"}}, {"id": 379, "text": "per", "bbox": {"l": 134.66666666666666, "t": 644.3333333333334, "r": 147.33333333333334, "b": 651.3333333333334, "coord_origin": "1"}}, {"id": 380, "text": "dataset.", "bbox": {"l": 149.66666666666666, "t": 642.0, "r": 179.0, "b": 649.0, "coord_origin": "1"}}, {"id": 381, "text": "1.2.", "bbox": {"l": 51.0, "t": 662.0, "r": 66.0, "b": 669.6666666666666, "coord_origin": "1"}}, {"id": 382, "text": "Synthetic", "bbox": {"l": 69.66666666666667, "t": 662.0, "r": 113.0, "b": 672.0, "coord_origin": "1"}}, {"id": 383, "text": "datasets", "bbox": {"l": 116.0, "t": 662.0, "r": 153.33333333333334, "b": 669.6666666666666, "coord_origin": "1"}}, {"id": 384, "text": "Aiming", "bbox": {"l": 62.333333333333336, "t": 681.0, "r": 92.0, "b": 690.0, "coord_origin": "1"}}, {"id": 385, "text": "to", "bbox": {"l": 96.66666666666667, "t": 682.3333333333334, "r": 104.0, "b": 688.0, "coord_origin": "1"}}, {"id": 386, "text": "train", "bbox": {"l": 108.66666666666667, "t": 681.0, "r": 126.33333333333333, "b": 688.0, "coord_origin": "1"}}, {"id": 387, "text": "and", "bbox": {"l": 130.66666666666666, "t": 681.0, "r": 144.66666666666666, "b": 688.0, "coord_origin": "1"}}, {"id": 388, "text": "evaluate", "bbox": {"l": 149.0, "t": 681.0, "r": 181.0, "b": 688.0, "coord_origin": "1"}}, {"id": 389, "text": "our", "bbox": {"l": 185.66666666666666, "t": 683.0, "r": 199.0, "b": 688.0, "coord_origin": "1"}}, {"id": 390, "text": "models", "bbox": {"l": 203.33333333333334, "t": 681.0, "r": 231.33333333333334, "b": 688.0, "coord_origin": "1"}}, {"id": 391, "text": "in", "bbox": {"l": 236.0, "t": 681.0, "r": 243.0, "b": 688.0, "coord_origin": "1"}}, {"id": 392, "text": "a", "bbox": {"l": 247.66666666666666, "t": 683.0, "r": 251.66666666666666, "b": 688.0, "coord_origin": "1"}}, {"id": 393, "text": "broader", "bbox": {"l": 256.0, "t": 681.0, "r": 286.3333333333333, "b": 688.0, "coord_origin": "1"}}, {"id": 394, "text": "spectrum", "bbox": {"l": 50.333333333333336, "t": 694.3333333333334, "r": 86.33333333333333, "b": 702.0, "coord_origin": "1"}}, {"id": 395, "text": "of", "bbox": {"l": 90.33333333333333, "t": 693.0, "r": 99.0, "b": 700.0, "coord_origin": "1"}}, {"id": 396, "text": "table", "bbox": {"l": 102.66666666666667, "t": 693.0, "r": 121.0, "b": 700.0, "coord_origin": "1"}}, {"id": 397, "text": "data", "bbox": {"l": 125.33333333333333, "t": 693.0, "r": 141.66666666666666, "b": 700.0, "coord_origin": "1"}}, {"id": 398, "text": "we", "bbox": {"l": 146.0, "t": 695.0, "r": 156.66666666666666, "b": 700.0, "coord_origin": "1"}}, {"id": 399, "text": "have", "bbox": {"l": 161.0, "t": 693.0, "r": 179.0, "b": 700.0, "coord_origin": "1"}}, {"id": 400, "text": "synthesized", "bbox": {"l": 183.33333333333334, "t": 693.0, "r": 229.0, "b": 702.0, "coord_origin": "1"}}, {"id": 401, "text": "four", "bbox": {"l": 233.33333333333334, "t": 693.0, "r": 249.66666666666666, "b": 700.0, "coord_origin": "1"}}, {"id": 402, "text": "types", "bbox": {"l": 253.66666666666666, "t": 694.3333333333334, "r": 274.0, "b": 702.0, "coord_origin": "1"}}, {"id": 403, "text": "of", "bbox": {"l": 278.3333333333333, "t": 693.0, "r": 286.6666666666667, "b": 700.0, "coord_origin": "1"}}, {"id": 404, "text": "datasets.", "bbox": {"l": 50.333333333333336, "t": 705.0, "r": 83.33333333333333, "b": 712.0, "coord_origin": "1"}}, {"id": 405, "text": "Each", "bbox": {"l": 91.66666666666667, "t": 705.0, "r": 110.66666666666667, "b": 712.0, "coord_origin": "1"}}, {"id": 406, "text": "one", "bbox": {"l": 115.0, "t": 707.0, "r": 129.0, "b": 712.0, "coord_origin": "1"}}, {"id": 407, "text": "contains", "bbox": {"l": 133.33333333333334, "t": 705.0, "r": 166.0, "b": 712.0, "coord_origin": "1"}}, {"id": 408, "text": "tables", "bbox": {"l": 170.33333333333334, "t": 705.0, "r": 193.0, "b": 712.0, "coord_origin": "1"}}, {"id": 409, "text": "with", "bbox": {"l": 197.66666666666666, "t": 705.0, "r": 214.66666666666666, "b": 712.0, "coord_origin": "1"}}, {"id": 410, "text": "different", "bbox": {"l": 219.0, "t": 705.0, "r": 252.66666666666666, "b": 712.0, "coord_origin": "1"}}, {"id": 411, "text": "appear-", "bbox": {"l": 257.0, "t": 707.0, "r": 286.0, "b": 714.0, "coord_origin": "1"}}, {"id": 412, "text": "ances", "bbox": {"l": 309.0, "t": 164.0, "r": 330.6666666666667, "b": 169.0, "coord_origin": "1"}}, {"id": 413, "text": "in", "bbox": {"l": 335.0, "t": 162.0, "r": 342.0, "b": 169.0, "coord_origin": "1"}}, {"id": 414, "text": "regard", "bbox": {"l": 346.6666666666667, "t": 162.0, "r": 371.0, "b": 171.0, "coord_origin": "1"}}, {"id": 415, "text": "to", "bbox": {"l": 375.6666666666667, "t": 163.33333333333337, "r": 383.0, "b": 169.0, "coord_origin": "1"}}, {"id": 416, "text": "their", "bbox": {"l": 387.3333333333333, "t": 162.0, "r": 405.0, "b": 169.0, "coord_origin": "1"}}, {"id": 417, "text": "size,", "bbox": {"l": 409.3333333333333, "t": 162.0, "r": 426.3333333333333, "b": 169.66666666666663, "coord_origin": "1"}}, {"id": 418, "text": "structure,", "bbox": {"l": 431.3333333333333, "t": 163.33333333333337, "r": 468.0, "b": 169.66666666666663, "coord_origin": "1"}}, {"id": 419, "text": "style", "bbox": {"l": 472.6666666666667, "t": 162.0, "r": 491.0, "b": 171.0, "coord_origin": "1"}}, {"id": 420, "text": "and", "bbox": {"l": 495.3333333333333, "t": 162.0, "r": 509.0, "b": 169.0, "coord_origin": "1"}}, {"id": 421, "text": "content.", "bbox": {"l": 513.3333333333334, "t": 163.33333333333337, "r": 544.3333333333334, "b": 169.0, "coord_origin": "1"}}, {"id": 422, "text": "Every", "bbox": {"l": 309.0, "t": 174.0, "r": 332.0, "b": 183.0, "coord_origin": "1"}}, {"id": 423, "text": "synthetic", "bbox": {"l": 336.0, "t": 174.0, "r": 371.0, "b": 183.0, "coord_origin": "1"}}, {"id": 424, "text": "dataset", "bbox": {"l": 374.6666666666667, "t": 174.0, "r": 402.0, "b": 181.0, "coord_origin": "1"}}, {"id": 425, "text": "contains", "bbox": {"l": 405.6666666666667, "t": 174.0, "r": 438.3333333333333, "b": 181.0, "coord_origin": "1"}}, {"id": 426, "text": "150k", "bbox": {"l": 443.3333333333333, "t": 174.0, "r": 461.3333333333333, "b": 181.0, "coord_origin": "1"}}, {"id": 427, "text": "examples,", "bbox": {"l": 465.0, "t": 174.0, "r": 504.0, "b": 183.0, "coord_origin": "1"}}, {"id": 428, "text": "summing", "bbox": {"l": 508.3333333333333, "t": 174.0, "r": 544.6666666666666, "b": 183.0, "coord_origin": "1"}}, {"id": 429, "text": "up", "bbox": {"l": 309.0, "t": 188.0, "r": 318.6666666666667, "b": 195.0, "coord_origin": "1"}}, {"id": 430, "text": "to", "bbox": {"l": 321.3333333333333, "t": 187.33333333333337, "r": 328.3333333333333, "b": 193.0, "coord_origin": "1"}}, {"id": 431, "text": "600k", "bbox": {"l": 331.3333333333333, "t": 186.0, "r": 350.6666666666667, "b": 193.0, "coord_origin": "1"}}, {"id": 432, "text": "synthetic", "bbox": {"l": 353.6666666666667, "t": 186.0, "r": 388.6666666666667, "b": 195.0, "coord_origin": "1"}}, {"id": 433, "text": "examples.", "bbox": {"l": 391.6666666666667, "t": 186.0, "r": 430.6666666666667, "b": 195.0, "coord_origin": "1"}}, {"id": 434, "text": "All", "bbox": {"l": 434.6666666666667, "t": 186.0, "r": 446.6666666666667, "b": 193.0, "coord_origin": "1"}}, {"id": 435, "text": "datasets", "bbox": {"l": 449.6666666666667, "t": 186.0, "r": 480.6666666666667, "b": 193.0, "coord_origin": "1"}}, {"id": 436, "text": "are", "bbox": {"l": 483.3333333333333, "t": 188.0, "r": 495.0, "b": 193.0, "coord_origin": "1"}}, {"id": 437, "text": "divided", "bbox": {"l": 497.6666666666667, "t": 186.0, "r": 527.0, "b": 193.0, "coord_origin": "1"}}, {"id": 438, "text": "into", "bbox": {"l": 530.0, "t": 186.0, "r": 545.0, "b": 193.0, "coord_origin": "1"}}, {"id": 439, "text": "Train,", "bbox": {"l": 309.0, "t": 198.0, "r": 332.0, "b": 205.66666666666663, "coord_origin": "1"}}, {"id": 440, "text": "Test", "bbox": {"l": 335.0, "t": 198.0, "r": 351.3333333333333, "b": 205.0, "coord_origin": "1"}}, {"id": 441, "text": "and", "bbox": {"l": 354.3333333333333, "t": 198.0, "r": 368.0, "b": 205.0, "coord_origin": "1"}}, {"id": 442, "text": "Val", "bbox": {"l": 371.0, "t": 198.0, "r": 383.6666666666667, "b": 205.0, "coord_origin": "1"}}, {"id": 443, "text": "splits", "bbox": {"l": 387.0, "t": 198.0, "r": 407.3333333333333, "b": 207.0, "coord_origin": "1"}}, {"id": 444, "text": "(80%,", "bbox": {"l": 410.3333333333333, "t": 198.0, "r": 433.6666666666667, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 445, "text": "10%,", "bbox": {"l": 438.0, "t": 198.0, "r": 457.0, "b": 205.66666666666663, "coord_origin": "1"}}, {"id": 446, "text": "10%).", "bbox": {"l": 461.3333333333333, "t": 198.0, "r": 483.3333333333333, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 447, "text": "The", "bbox": {"l": 321.0, "t": 211.0, "r": 336.0, "b": 218.0, "coord_origin": "1"}}, {"id": 448, "text": "process", "bbox": {"l": 339.3333333333333, "t": 213.0, "r": 368.6666666666667, "b": 220.0, "coord_origin": "1"}}, {"id": 449, "text": "of", "bbox": {"l": 372.0, "t": 211.0, "r": 380.3333333333333, "b": 218.0, "coord_origin": "1"}}, {"id": 450, "text": "generating", "bbox": {"l": 382.6666666666667, "t": 211.0, "r": 424.3333333333333, "b": 220.0, "coord_origin": "1"}}, {"id": 451, "text": "a", "bbox": {"l": 427.6666666666667, "t": 213.0, "r": 431.6666666666667, "b": 218.0, "coord_origin": "1"}}, {"id": 452, "text": "synthetic", "bbox": {"l": 435.0, "t": 211.0, "r": 470.0, "b": 220.0, "coord_origin": "1"}}, {"id": 453, "text": "dataset", "bbox": {"l": 473.3333333333333, "t": 211.0, "r": 500.6666666666667, "b": 218.0, "coord_origin": "1"}}, {"id": 454, "text": "can", "bbox": {"l": 504.0, "t": 213.0, "r": 517.0, "b": 218.0, "coord_origin": "1"}}, {"id": 455, "text": "be", "bbox": {"l": 520.6666666666666, "t": 211.0, "r": 529.0, "b": 218.0, "coord_origin": "1"}}, {"id": 456, "text": "de-", "bbox": {"l": 532.6666666666666, "t": 211.0, "r": 544.6666666666666, "b": 218.0, "coord_origin": "1"}}, {"id": 457, "text": "composed", "bbox": {"l": 309.0, "t": 223.0, "r": 348.6666666666667, "b": 232.0, "coord_origin": "1"}}, {"id": 458, "text": "into", "bbox": {"l": 352.0, "t": 223.0, "r": 367.0, "b": 230.0, "coord_origin": "1"}}, {"id": 459, "text": "the", "bbox": {"l": 370.0, "t": 223.0, "r": 381.3333333333333, "b": 230.0, "coord_origin": "1"}}, {"id": 460, "text": "following", "bbox": {"l": 384.6666666666667, "t": 223.0, "r": 422.3333333333333, "b": 232.0, "coord_origin": "1"}}, {"id": 461, "text": "steps:", "bbox": {"l": 425.6666666666667, "t": 224.33333333333337, "r": 447.0, "b": 232.0, "coord_origin": "1"}}, {"id": 462, "text": "1.", "bbox": {"l": 322.3333333333333, "t": 235.66666666666663, "r": 327.3333333333333, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 463, "text": "Prepare", "bbox": {"l": 335.6666666666667, "t": 235.33333333333337, "r": 365.3333333333333, "b": 244.66666666666663, "coord_origin": "1"}}, {"id": 464, "text": "styling", "bbox": {"l": 370.0, "t": 235.33333333333337, "r": 396.3333333333333, "b": 244.66666666666663, "coord_origin": "1"}}, {"id": 465, "text": "and", "bbox": {"l": 400.6666666666667, "t": 235.33333333333337, "r": 414.6666666666667, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 466, "text": "content", "bbox": {"l": 419.0, "t": 236.66666666666663, "r": 447.6666666666667, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 467, "text": "templates:", "bbox": {"l": 452.3333333333333, "t": 235.33333333333337, "r": 492.0, "b": 244.66666666666663, "coord_origin": "1"}}, {"id": 468, "text": "The", "bbox": {"l": 498.6666666666667, "t": 235.33333333333337, "r": 513.6666666666666, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 469, "text": "styling", "bbox": {"l": 518.3333333333334, "t": 235.33333333333337, "r": 544.6666666666666, "b": 244.66666666666663, "coord_origin": "1"}}, {"id": 470, "text": "templates", "bbox": {"l": 309.0, "t": 247.33333333333337, "r": 346.6666666666667, "b": 256.66666666666674, "coord_origin": "1"}}, {"id": 471, "text": "have", "bbox": {"l": 350.0, "t": 247.33333333333337, "r": 368.0, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 472, "text": "been", "bbox": {"l": 371.3333333333333, "t": 247.33333333333337, "r": 389.3333333333333, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 473, "text": "manually", "bbox": {"l": 393.0, "t": 247.33333333333337, "r": 429.3333333333333, "b": 256.66666666666674, "coord_origin": "1"}}, {"id": 474, "text": "designed", "bbox": {"l": 432.3333333333333, "t": 247.33333333333337, "r": 467.3333333333333, "b": 256.66666666666674, "coord_origin": "1"}}, {"id": 475, "text": "and", "bbox": {"l": 471.0, "t": 247.33333333333337, "r": 484.6666666666667, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 476, "text": "organized", "bbox": {"l": 488.0, "t": 247.33333333333337, "r": 526.3333333333334, "b": 256.66666666666674, "coord_origin": "1"}}, {"id": 477, "text": "into", "bbox": {"l": 530.0, "t": 247.33333333333337, "r": 545.0, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 478, "text": "groups", "bbox": {"l": 309.0, "t": 261.66666666666674, "r": 335.6666666666667, "b": 268.66666666666674, "coord_origin": "1"}}, {"id": 479, "text": "of", "bbox": {"l": 339.6666666666667, "t": 259.33333333333326, "r": 348.3333333333333, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 480, "text": "scope", "bbox": {"l": 351.6666666666667, "t": 261.66666666666674, "r": 373.6666666666667, "b": 268.66666666666674, "coord_origin": "1"}}, {"id": 481, "text": "specific", "bbox": {"l": 378.0, "t": 259.33333333333326, "r": 407.6666666666667, "b": 268.66666666666674, "coord_origin": "1"}}, {"id": 482, "text": "appearances", "bbox": {"l": 412.0, "t": 261.66666666666674, "r": 460.0, "b": 268.66666666666674, "coord_origin": "1"}}, {"id": 483, "text": "(e.g.", "bbox": {"l": 464.3333333333333, "t": 260.0, "r": 481.0, "b": 268.66666666666674, "coord_origin": "1"}}, {"id": 484, "text": "financial", "bbox": {"l": 488.6666666666667, "t": 259.33333333333326, "r": 522.0, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 485, "text": "data,", "bbox": {"l": 526.0, "t": 259.33333333333326, "r": 544.3333333333334, "b": 267.0, "coord_origin": "1"}}, {"id": 486, "text": "marketing", "bbox": {"l": 309.0, "t": 271.33333333333326, "r": 349.0, "b": 280.6666666666667, "coord_origin": "1"}}, {"id": 487, "text": "data,", "bbox": {"l": 353.0, "t": 271.33333333333326, "r": 371.3333333333333, "b": 279.33333333333326, "coord_origin": "1"}}, {"id": 488, "text": "etc.)", "bbox": {"l": 376.0, "t": 271.66666666666674, "r": 393.0, "b": 279.66666666666674, "coord_origin": "1"}}, {"id": 489, "text": "Additionally,", "bbox": {"l": 400.3333333333333, "t": 271.33333333333326, "r": 451.6666666666667, "b": 280.6666666666667, "coord_origin": "1"}}, {"id": 490, "text": "we", "bbox": {"l": 456.6666666666667, "t": 273.66666666666674, "r": 467.6666666666667, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 491, "text": "have", "bbox": {"l": 472.0, "t": 271.33333333333326, "r": 489.6666666666667, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 492, "text": "prepared", "bbox": {"l": 494.0, "t": 271.33333333333326, "r": 528.3333333333334, "b": 280.6666666666667, "coord_origin": "1"}}, {"id": 493, "text": "cu-", "bbox": {"l": 532.3333333333334, "t": 273.66666666666674, "r": 544.6666666666666, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 494, "text": "rated", "bbox": {"l": 309.0, "t": 283.3333333333333, "r": 328.3333333333333, "b": 290.3333333333333, "coord_origin": "1"}}, {"id": 495, "text": "collections", "bbox": {"l": 331.0, "t": 283.3333333333333, "r": 373.6666666666667, "b": 290.3333333333333, "coord_origin": "1"}}, {"id": 496, "text": "of", "bbox": {"l": 376.3333333333333, "t": 283.3333333333333, "r": 384.6666666666667, "b": 290.3333333333333, "coord_origin": "1"}}, {"id": 497, "text": "content", "bbox": {"l": 386.3333333333333, "t": 284.6666666666667, "r": 415.3333333333333, "b": 290.3333333333333, "coord_origin": "1"}}, {"id": 498, "text": "templates", "bbox": {"l": 418.0, "t": 283.3333333333333, "r": 455.6666666666667, "b": 292.6666666666667, "coord_origin": "1"}}, {"id": 499, "text": "by", "bbox": {"l": 458.0, "t": 283.3333333333333, "r": 467.3333333333333, "b": 292.6666666666667, "coord_origin": "1"}}, {"id": 500, "text": "extracting", "bbox": {"l": 470.0, "t": 283.3333333333333, "r": 509.3333333333333, "b": 292.6666666666667, "coord_origin": "1"}}, {"id": 501, "text": "the", "bbox": {"l": 511.6666666666667, "t": 283.3333333333333, "r": 523.3333333333334, "b": 290.3333333333333, "coord_origin": "1"}}, {"id": 502, "text": "most", "bbox": {"l": 526.0, "t": 284.6666666666667, "r": 544.6666666666666, "b": 290.3333333333333, "coord_origin": "1"}}, {"id": 503, "text": "frequently", "bbox": {"l": 309.3333333333333, "t": 295.3333333333333, "r": 349.3333333333333, "b": 304.6666666666667, "coord_origin": "1"}}, {"id": 504, "text": "used", "bbox": {"l": 354.6666666666667, "t": 295.3333333333333, "r": 372.0, "b": 302.3333333333333, "coord_origin": "1"}}, {"id": 505, "text": "terms", "bbox": {"l": 377.0, "t": 296.6666666666667, "r": 398.3333333333333, "b": 302.3333333333333, "coord_origin": "1"}}, {"id": 506, "text": "out", "bbox": {"l": 403.3333333333333, "t": 296.6666666666667, "r": 415.6666666666667, "b": 302.3333333333333, "coord_origin": "1"}}, {"id": 507, "text": "of", "bbox": {"l": 420.3333333333333, "t": 295.3333333333333, "r": 429.0, "b": 302.3333333333333, "coord_origin": "1"}}, {"id": 508, "text": "non-synthetic", "bbox": {"l": 433.0, "t": 295.3333333333333, "r": 486.6666666666667, "b": 304.6666666666667, "coord_origin": "1"}}, {"id": 509, "text": "datasets", "bbox": {"l": 491.6666666666667, "t": 295.3333333333333, "r": 522.6666666666666, "b": 302.3333333333333, "coord_origin": "1"}}, {"id": 510, "text": "(e.g.", "bbox": {"l": 527.6666666666666, "t": 295.6666666666667, "r": 544.3333333333334, "b": 304.6666666666667, "coord_origin": "1"}}, {"id": 511, "text": "PubTabNet,", "bbox": {"l": 309.0, "t": 307.0, "r": 355.3333333333333, "b": 314.6666666666667, "coord_origin": "1"}}, {"id": 512, "text": "FinTabNet,", "bbox": {"l": 358.6666666666667, "t": 307.0, "r": 402.6666666666667, "b": 314.6666666666667, "coord_origin": "1"}}, {"id": 513, "text": "etc.).", "bbox": {"l": 406.0, "t": 307.6666666666667, "r": 425.0, "b": 315.3333333333333, "coord_origin": "1"}}, {"id": 514, "text": "2.", "bbox": {"l": 321.0, "t": 320.0, "r": 327.3333333333333, "b": 327.0, "coord_origin": "1"}}, {"id": 515, "text": "Generate", "bbox": {"l": 333.0, "t": 320.0, "r": 368.3333333333333, "b": 327.0, "coord_origin": "1"}}, {"id": 516, "text": "table", "bbox": {"l": 372.0, "t": 320.0, "r": 390.6666666666667, "b": 327.0, "coord_origin": "1"}}, {"id": 517, "text": "structures:", "bbox": {"l": 394.3333333333333, "t": 321.0, "r": 434.3333333333333, "b": 327.0, "coord_origin": "1"}}, {"id": 518, "text": "The", "bbox": {"l": 439.3333333333333, "t": 320.0, "r": 454.3333333333333, "b": 327.0, "coord_origin": "1"}}, {"id": 519, "text": "structure", "bbox": {"l": 458.0, "t": 321.3333333333333, "r": 492.3333333333333, "b": 327.0, "coord_origin": "1"}}, {"id": 520, "text": "of", "bbox": {"l": 495.6666666666667, "t": 320.0, "r": 504.3333333333333, "b": 327.0, "coord_origin": "1"}}, {"id": 521, "text": "each", "bbox": {"l": 507.0, "t": 320.0, "r": 524.6666666666666, "b": 327.0, "coord_origin": "1"}}, {"id": 522, "text": "syn-", "bbox": {"l": 528.3333333333334, "t": 322.0, "r": 544.6666666666666, "b": 329.0, "coord_origin": "1"}}, {"id": 523, "text": "thetic", "bbox": {"l": 309.0, "t": 332.0, "r": 330.6666666666667, "b": 339.0, "coord_origin": "1"}}, {"id": 524, "text": "dataset", "bbox": {"l": 334.3333333333333, "t": 332.0, "r": 361.3333333333333, "b": 339.0, "coord_origin": "1"}}, {"id": 525, "text": "assumes", "bbox": {"l": 365.0, "t": 334.0, "r": 397.6666666666667, "b": 339.0, "coord_origin": "1"}}, {"id": 526, "text": "a", "bbox": {"l": 401.3333333333333, "t": 334.0, "r": 405.3333333333333, "b": 339.0, "coord_origin": "1"}}, {"id": 527, "text": "horizontal", "bbox": {"l": 409.0, "t": 332.0, "r": 448.6666666666667, "b": 339.0, "coord_origin": "1"}}, {"id": 528, "text": "table", "bbox": {"l": 452.6666666666667, "t": 332.0, "r": 471.3333333333333, "b": 339.0, "coord_origin": "1"}}, {"id": 529, "text": "header", "bbox": {"l": 475.0, "t": 332.0, "r": 501.3333333333333, "b": 339.0, "coord_origin": "1"}}, {"id": 530, "text": "which", "bbox": {"l": 504.6666666666667, "t": 332.0, "r": 528.3333333333334, "b": 339.0, "coord_origin": "1"}}, {"id": 531, "text": "po-", "bbox": {"l": 532.0, "t": 334.0, "r": 544.6666666666666, "b": 341.0, "coord_origin": "1"}}, {"id": 532, "text": "tentially", "bbox": {"l": 309.0, "t": 344.0, "r": 341.0, "b": 353.0, "coord_origin": "1"}}, {"id": 533, "text": "spans", "bbox": {"l": 346.0, "t": 346.0, "r": 367.6666666666667, "b": 353.0, "coord_origin": "1"}}, {"id": 534, "text": "over", "bbox": {"l": 372.3333333333333, "t": 346.0, "r": 389.6666666666667, "b": 351.0, "coord_origin": "1"}}, {"id": 535, "text": "multiple", "bbox": {"l": 394.3333333333333, "t": 344.0, "r": 426.6666666666667, "b": 353.0, "coord_origin": "1"}}, {"id": 536, "text": "rows", "bbox": {"l": 431.6666666666667, "t": 346.0, "r": 450.3333333333333, "b": 351.0, "coord_origin": "1"}}, {"id": 537, "text": "and", "bbox": {"l": 455.0, "t": 344.0, "r": 468.6666666666667, "b": 351.0, "coord_origin": "1"}}, {"id": 538, "text": "a", "bbox": {"l": 473.6666666666667, "t": 346.0, "r": 477.6666666666667, "b": 351.0, "coord_origin": "1"}}, {"id": 539, "text": "table", "bbox": {"l": 482.6666666666667, "t": 344.0, "r": 501.3333333333333, "b": 351.0, "coord_origin": "1"}}, {"id": 540, "text": "body", "bbox": {"l": 506.3333333333333, "t": 344.0, "r": 525.3333333333334, "b": 353.0, "coord_origin": "1"}}, {"id": 541, "text": "that", "bbox": {"l": 530.6666666666666, "t": 344.0, "r": 544.6666666666666, "b": 351.0, "coord_origin": "1"}}, {"id": 542, "text": "may", "bbox": {"l": 309.0, "t": 358.0, "r": 325.6666666666667, "b": 365.0, "coord_origin": "1"}}, {"id": 543, "text": "contain", "bbox": {"l": 328.3333333333333, "t": 356.0, "r": 357.3333333333333, "b": 363.0, "coord_origin": "1"}}, {"id": 544, "text": "a", "bbox": {"l": 360.3333333333333, "t": 358.0, "r": 364.3333333333333, "b": 363.0, "coord_origin": "1"}}, {"id": 545, "text": "combination", "bbox": {"l": 367.0, "t": 356.0, "r": 416.0, "b": 363.0, "coord_origin": "1"}}, {"id": 546, "text": "of", "bbox": {"l": 419.0, "t": 356.0, "r": 427.6666666666667, "b": 363.0, "coord_origin": "1"}}, {"id": 547, "text": "row", "bbox": {"l": 429.6666666666667, "t": 358.0, "r": 444.3333333333333, "b": 363.0, "coord_origin": "1"}}, {"id": 548, "text": "spans", "bbox": {"l": 447.3333333333333, "t": 358.0, "r": 468.6666666666667, "b": 365.0, "coord_origin": "1"}}, {"id": 549, "text": "and", "bbox": {"l": 471.6666666666667, "t": 356.0, "r": 485.3333333333333, "b": 363.0, "coord_origin": "1"}}, {"id": 550, "text": "column", "bbox": {"l": 488.3333333333333, "t": 356.0, "r": 517.6666666666666, "b": 363.0, "coord_origin": "1"}}, {"id": 551, "text": "spans.", "bbox": {"l": 520.6666666666666, "t": 358.0, "r": 544.3333333333334, "b": 365.0, "coord_origin": "1"}}, {"id": 552, "text": "However,", "bbox": {"l": 309.3333333333333, "t": 368.0, "r": 346.3333333333333, "b": 375.6666666666667, "coord_origin": "1"}}, {"id": 553, "text": "spans", "bbox": {"l": 350.3333333333333, "t": 370.0, "r": 371.6666666666667, "b": 377.0, "coord_origin": "1"}}, {"id": 554, "text": "are", "bbox": {"l": 375.3333333333333, "t": 370.0, "r": 386.6666666666667, "b": 375.0, "coord_origin": "1"}}, {"id": 555, "text": "not", "bbox": {"l": 390.3333333333333, "t": 369.0, "r": 402.6666666666667, "b": 375.0, "coord_origin": "1"}}, {"id": 556, "text": "allowed", "bbox": {"l": 406.0, "t": 368.0, "r": 436.6666666666667, "b": 375.0, "coord_origin": "1"}}, {"id": 557, "text": "to", "bbox": {"l": 440.3333333333333, "t": 369.3333333333333, "r": 447.6666666666667, "b": 375.0, "coord_origin": "1"}}, {"id": 558, "text": "cross", "bbox": {"l": 451.0, "t": 370.0, "r": 471.0, "b": 375.0, "coord_origin": "1"}}, {"id": 559, "text": "the", "bbox": {"l": 474.6666666666667, "t": 368.0, "r": 486.0, "b": 375.0, "coord_origin": "1"}}, {"id": 560, "text": "header", "bbox": {"l": 489.6666666666667, "t": 368.0, "r": 516.0, "b": 375.0, "coord_origin": "1"}}, {"id": 561, "text": "-", "bbox": {"l": 519.3333333333334, "t": 372.0, "r": 521.6666666666666, "b": 373.0, "coord_origin": "1"}}, {"id": 562, "text": "body", "bbox": {"l": 525.3333333333334, "t": 368.0, "r": 544.6666666666666, "b": 377.0, "coord_origin": "1"}}, {"id": 563, "text": "boundary.", "bbox": {"l": 309.0, "t": 380.0, "r": 347.6666666666667, "b": 389.0, "coord_origin": "1"}}, {"id": 564, "text": "The", "bbox": {"l": 353.6666666666667, "t": 380.0, "r": 368.6666666666667, "b": 387.0, "coord_origin": "1"}}, {"id": 565, "text": "table", "bbox": {"l": 372.3333333333333, "t": 380.0, "r": 391.3333333333333, "b": 387.0, "coord_origin": "1"}}, {"id": 566, "text": "structure", "bbox": {"l": 395.0, "t": 381.3333333333333, "r": 429.3333333333333, "b": 387.0, "coord_origin": "1"}}, {"id": 567, "text": "is", "bbox": {"l": 433.0, "t": 380.0, "r": 439.0, "b": 387.0, "coord_origin": "1"}}, {"id": 568, "text": "described", "bbox": {"l": 442.6666666666667, "t": 380.0, "r": 480.3333333333333, "b": 387.0, "coord_origin": "1"}}, {"id": 569, "text": "by", "bbox": {"l": 484.3333333333333, "t": 380.0, "r": 493.3333333333333, "b": 389.0, "coord_origin": "1"}}, {"id": 570, "text": "the", "bbox": {"l": 497.3333333333333, "t": 380.0, "r": 509.0, "b": 387.0, "coord_origin": "1"}}, {"id": 571, "text": "parame-", "bbox": {"l": 512.6666666666666, "t": 382.0, "r": 544.6666666666666, "b": 389.0, "coord_origin": "1"}}, {"id": 572, "text": "ters:", "bbox": {"l": 309.0, "t": 392.6666666666667, "r": 325.0, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 573, "text": "Total", "bbox": {"l": 331.0, "t": 391.6666666666667, "r": 350.6666666666667, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 574, "text": "number", "bbox": {"l": 354.6666666666667, "t": 391.6666666666667, "r": 385.0, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 575, "text": "of", "bbox": {"l": 388.6666666666667, "t": 391.3333333333333, "r": 397.0, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 576, "text": "table", "bbox": {"l": 400.3333333333333, "t": 391.6666666666667, "r": 419.0, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 577, "text": "rows", "bbox": {"l": 423.0, "t": 393.6666666666667, "r": 441.6666666666667, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 578, "text": "and", "bbox": {"l": 445.6666666666667, "t": 391.3333333333333, "r": 459.3333333333333, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 579, "text": "columns,", "bbox": {"l": 463.3333333333333, "t": 391.3333333333333, "r": 498.6666666666667, "b": 399.0, "coord_origin": "1"}}, {"id": 580, "text": "number", "bbox": {"l": 503.3333333333333, "t": 391.3333333333333, "r": 533.3333333333334, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 581, "text": "of", "bbox": {"l": 537.0, "t": 391.3333333333333, "r": 545.3333333333334, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 582, "text": "header", "bbox": {"l": 309.0, "t": 403.3333333333333, "r": 335.3333333333333, "b": 410.3333333333333, "coord_origin": "1"}}, {"id": 583, "text": "rows,", "bbox": {"l": 339.3333333333333, "t": 405.6666666666667, "r": 360.3333333333333, "b": 411.3333333333333, "coord_origin": "1"}}, {"id": 584, "text": "type", "bbox": {"l": 365.3333333333333, "t": 404.6666666666667, "r": 381.6666666666667, "b": 412.6666666666667, "coord_origin": "1"}}, {"id": 585, "text": "of", "bbox": {"l": 386.3333333333333, "t": 403.3333333333333, "r": 394.6666666666667, "b": 410.3333333333333, "coord_origin": "1"}}, {"id": 586, "text": "spans", "bbox": {"l": 398.6666666666667, "t": 405.6666666666667, "r": 420.0, "b": 412.6666666666667, "coord_origin": "1"}}, {"id": 587, "text": "(header", "bbox": {"l": 424.6666666666667, "t": 403.3333333333333, "r": 454.0, "b": 411.6666666666667, "coord_origin": "1"}}, {"id": 588, "text": "only", "bbox": {"l": 458.0, "t": 403.6666666666667, "r": 475.3333333333333, "b": 412.6666666666667, "coord_origin": "1"}}, {"id": 589, "text": "spans,", "bbox": {"l": 480.0, "t": 405.6666666666667, "r": 503.6666666666667, "b": 412.6666666666667, "coord_origin": "1"}}, {"id": 590, "text": "row", "bbox": {"l": 508.3333333333333, "t": 405.6666666666667, "r": 523.0, "b": 410.3333333333333, "coord_origin": "1"}}, {"id": 591, "text": "only", "bbox": {"l": 527.6666666666666, "t": 403.6666666666667, "r": 544.6666666666666, "b": 412.6666666666667, "coord_origin": "1"}}, {"id": 592, "text": "spans,", "bbox": {"l": 309.0, "t": 417.6666666666667, "r": 333.0, "b": 424.6666666666667, "coord_origin": "1"}}, {"id": 593, "text": "column", "bbox": {"l": 338.3333333333333, "t": 415.6666666666667, "r": 367.3333333333333, "b": 422.3333333333333, "coord_origin": "1"}}, {"id": 594, "text": "only", "bbox": {"l": 372.3333333333333, "t": 415.6666666666667, "r": 389.3333333333333, "b": 424.6666666666667, "coord_origin": "1"}}, {"id": 595, "text": "spans,", "bbox": {"l": 394.3333333333333, "t": 417.6666666666667, "r": 418.0, "b": 424.6666666666667, "coord_origin": "1"}}, {"id": 596, "text": "both", "bbox": {"l": 423.6666666666667, "t": 415.6666666666667, "r": 440.6666666666667, "b": 422.3333333333333, "coord_origin": "1"}}, {"id": 597, "text": "row", "bbox": {"l": 445.3333333333333, "t": 417.6666666666667, "r": 460.0, "b": 422.3333333333333, "coord_origin": "1"}}, {"id": 598, "text": "and", "bbox": {"l": 464.6666666666667, "t": 415.6666666666667, "r": 478.3333333333333, "b": 422.3333333333333, "coord_origin": "1"}}, {"id": 599, "text": "column", "bbox": {"l": 483.3333333333333, "t": 415.6666666666667, "r": 512.6666666666666, "b": 422.3333333333333, "coord_origin": "1"}}, {"id": 600, "text": "spans),", "bbox": {"l": 517.3333333333334, "t": 415.6666666666667, "r": 544.3333333333334, "b": 424.6666666666667, "coord_origin": "1"}}, {"id": 601, "text": "maximum", "bbox": {"l": 309.0, "t": 427.3333333333333, "r": 348.6666666666667, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 602, "text": "span", "bbox": {"l": 352.6666666666667, "t": 429.6666666666667, "r": 370.0, "b": 436.6666666666667, "coord_origin": "1"}}, {"id": 603, "text": "size", "bbox": {"l": 374.0, "t": 427.3333333333333, "r": 388.6666666666667, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 604, "text": "and", "bbox": {"l": 392.0, "t": 427.6666666666667, "r": 406.0, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 605, "text": "the", "bbox": {"l": 409.6666666666667, "t": 427.6666666666667, "r": 421.0, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 606, "text": "ratio", "bbox": {"l": 424.6666666666667, "t": 427.3333333333333, "r": 442.3333333333333, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 607, "text": "of", "bbox": {"l": 445.6666666666667, "t": 427.3333333333333, "r": 454.3333333333333, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 608, "text": "the", "bbox": {"l": 457.3333333333333, "t": 427.6666666666667, "r": 468.6666666666667, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 609, "text": "table", "bbox": {"l": 472.3333333333333, "t": 427.6666666666667, "r": 491.0, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 610, "text": "area", "bbox": {"l": 494.6666666666667, "t": 429.6666666666667, "r": 510.6666666666667, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 611, "text": "covered", "bbox": {"l": 514.0, "t": 427.6666666666667, "r": 544.6666666666666, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 612, "text": "by", "bbox": {"l": 309.0, "t": 439.6666666666667, "r": 318.3333333333333, "b": 448.6666666666667, "coord_origin": "1"}}, {"id": 613, "text": "spans.", "bbox": {"l": 321.6666666666667, "t": 441.6666666666667, "r": 345.3333333333333, "b": 448.6666666666667, "coord_origin": "1"}}, {"id": 614, "text": "3.", "bbox": {"l": 321.0, "t": 452.3333333333333, "r": 327.3333333333333, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 615, "text": "Generate", "bbox": {"l": 331.3333333333333, "t": 452.3333333333333, "r": 366.6666666666667, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 616, "text": "content:", "bbox": {"l": 369.6666666666667, "t": 453.6666666666667, "r": 401.0, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 617, "text": "Based", "bbox": {"l": 405.0, "t": 452.3333333333333, "r": 428.6666666666667, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 618, "text": "on", "bbox": {"l": 431.3333333333333, "t": 454.6666666666667, "r": 441.0, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 619, "text": "the", "bbox": {"l": 444.0, "t": 452.3333333333333, "r": 455.3333333333333, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 620, "text": "dataset", "bbox": {"l": 458.3333333333333, "t": 452.3333333333333, "r": 485.3333333333333, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 621, "text": "theme,", "bbox": {"l": 488.3333333333333, "t": 452.3333333333333, "r": 513.6666666666666, "b": 460.3333333333333, "coord_origin": "1"}}, {"id": 622, "text": "a", "bbox": {"l": 517.0, "t": 454.6666666666667, "r": 521.0, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 623, "text": "set", "bbox": {"l": 523.6666666666666, "t": 453.6666666666667, "r": 534.0, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 624, "text": "of", "bbox": {"l": 537.0, "t": 452.3333333333333, "r": 545.3333333333334, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 625, "text": "suitable", "bbox": {"l": 309.0, "t": 464.0, "r": 339.3333333333333, "b": 471.0, "coord_origin": "1"}}, {"id": 626, "text": "content", "bbox": {"l": 342.3333333333333, "t": 465.3333333333333, "r": 371.0, "b": 471.0, "coord_origin": "1"}}, {"id": 627, "text": "templates", "bbox": {"l": 374.0, "t": 464.0, "r": 411.3333333333333, "b": 473.0, "coord_origin": "1"}}, {"id": 628, "text": "is", "bbox": {"l": 414.3333333333333, "t": 464.0, "r": 420.3333333333333, "b": 471.0, "coord_origin": "1"}}, {"id": 629, "text": "chosen", "bbox": {"l": 423.0, "t": 464.0, "r": 450.3333333333333, "b": 471.0, "coord_origin": "1"}}, {"id": 630, "text": "first.", "bbox": {"l": 453.3333333333333, "t": 464.0, "r": 470.0, "b": 471.0, "coord_origin": "1"}}, {"id": 631, "text": "Then,", "bbox": {"l": 474.0, "t": 464.0, "r": 496.3333333333333, "b": 471.6666666666667, "coord_origin": "1"}}, {"id": 632, "text": "this", "bbox": {"l": 499.3333333333333, "t": 464.0, "r": 513.3333333333334, "b": 471.0, "coord_origin": "1"}}, {"id": 633, "text": "content", "bbox": {"l": 516.0, "t": 465.3333333333333, "r": 544.6666666666666, "b": 471.0, "coord_origin": "1"}}, {"id": 634, "text": "can", "bbox": {"l": 309.0, "t": 478.0, "r": 322.3333333333333, "b": 483.0, "coord_origin": "1"}}, {"id": 635, "text": "be", "bbox": {"l": 326.6666666666667, "t": 476.0, "r": 335.3333333333333, "b": 483.0, "coord_origin": "1"}}, {"id": 636, "text": "combined", "bbox": {"l": 339.6666666666667, "t": 476.0, "r": 378.3333333333333, "b": 483.0, "coord_origin": "1"}}, {"id": 637, "text": "with", "bbox": {"l": 383.0, "t": 476.0, "r": 400.0, "b": 483.0, "coord_origin": "1"}}, {"id": 638, "text": "purely", "bbox": {"l": 404.0, "t": 476.0, "r": 428.6666666666667, "b": 485.0, "coord_origin": "1"}}, {"id": 639, "text": "random", "bbox": {"l": 433.3333333333333, "t": 476.0, "r": 463.0, "b": 483.0, "coord_origin": "1"}}, {"id": 640, "text": "text", "bbox": {"l": 467.3333333333333, "t": 477.3333333333333, "r": 481.6666666666667, "b": 483.0, "coord_origin": "1"}}, {"id": 641, "text": "to", "bbox": {"l": 486.0, "t": 477.3333333333333, "r": 493.0, "b": 483.0, "coord_origin": "1"}}, {"id": 642, "text": "produce", "bbox": {"l": 497.3333333333333, "t": 476.0, "r": 528.6666666666666, "b": 485.0, "coord_origin": "1"}}, {"id": 643, "text": "the", "bbox": {"l": 533.3333333333334, "t": 476.0, "r": 544.6666666666666, "b": 483.0, "coord_origin": "1"}}, {"id": 644, "text": "synthetic", "bbox": {"l": 309.0, "t": 488.0, "r": 344.3333333333333, "b": 497.0, "coord_origin": "1"}}, {"id": 645, "text": "content.", "bbox": {"l": 347.3333333333333, "t": 489.0, "r": 378.3333333333333, "b": 495.0, "coord_origin": "1"}}, {"id": 646, "text": "4.", "bbox": {"l": 320.6666666666667, "t": 501.0, "r": 327.3333333333333, "b": 508.0, "coord_origin": "1"}}, {"id": 647, "text": "Apply", "bbox": {"l": 334.3333333333333, "t": 501.0, "r": 358.6666666666667, "b": 510.0, "coord_origin": "1"}}, {"id": 648, "text": "styling", "bbox": {"l": 363.0, "t": 501.0, "r": 389.3333333333333, "b": 510.0, "coord_origin": "1"}}, {"id": 649, "text": "templates:", "bbox": {"l": 393.3333333333333, "t": 501.0, "r": 433.3333333333333, "b": 510.0, "coord_origin": "1"}}, {"id": 650, "text": "Depending", "bbox": {"l": 439.3333333333333, "t": 501.0, "r": 482.3333333333333, "b": 510.0, "coord_origin": "1"}}, {"id": 651, "text": "on", "bbox": {"l": 486.3333333333333, "t": 503.0, "r": 495.6666666666667, "b": 508.0, "coord_origin": "1"}}, {"id": 652, "text": "the", "bbox": {"l": 500.0, "t": 501.0, "r": 511.3333333333333, "b": 508.0, "coord_origin": "1"}}, {"id": 653, "text": "domain", "bbox": {"l": 515.3333333333334, "t": 501.0, "r": 544.6666666666666, "b": 508.0, "coord_origin": "1"}}, {"id": 654, "text": "of", "bbox": {"l": 309.0, "t": 513.0, "r": 317.6666666666667, "b": 520.0, "coord_origin": "1"}}, {"id": 655, "text": "the", "bbox": {"l": 321.3333333333333, "t": 513.0, "r": 332.6666666666667, "b": 520.0, "coord_origin": "1"}}, {"id": 656, "text": "synthetic", "bbox": {"l": 337.3333333333333, "t": 513.0, "r": 372.3333333333333, "b": 522.0, "coord_origin": "1"}}, {"id": 657, "text": "dataset,", "bbox": {"l": 376.6666666666667, "t": 513.0, "r": 406.3333333333333, "b": 520.6666666666666, "coord_origin": "1"}}, {"id": 658, "text": "a", "bbox": {"l": 411.3333333333333, "t": 515.0, "r": 415.3333333333333, "b": 520.0, "coord_origin": "1"}}, {"id": 659, "text": "set", "bbox": {"l": 419.6666666666667, "t": 514.0, "r": 430.0, "b": 520.0, "coord_origin": "1"}}, {"id": 660, "text": "of", "bbox": {"l": 434.3333333333333, "t": 513.0, "r": 443.0, "b": 520.0, "coord_origin": "1"}}, {"id": 661, "text": "styling", "bbox": {"l": 446.6666666666667, "t": 513.0, "r": 473.0, "b": 522.0, "coord_origin": "1"}}, {"id": 662, "text": "templates", "bbox": {"l": 477.3333333333333, "t": 513.0, "r": 515.0, "b": 522.0, "coord_origin": "1"}}, {"id": 663, "text": "is", "bbox": {"l": 519.6666666666666, "t": 513.0, "r": 525.3333333333334, "b": 520.0, "coord_origin": "1"}}, {"id": 664, "text": "first", "bbox": {"l": 530.0, "t": 513.0, "r": 544.6666666666666, "b": 520.0, "coord_origin": "1"}}, {"id": 665, "text": "manually", "bbox": {"l": 309.0, "t": 525.0, "r": 345.3333333333333, "b": 534.0, "coord_origin": "1"}}, {"id": 666, "text": "selected.", "bbox": {"l": 350.0, "t": 525.0, "r": 383.6666666666667, "b": 532.0, "coord_origin": "1"}}, {"id": 667, "text": "Then,", "bbox": {"l": 391.3333333333333, "t": 525.0, "r": 413.6666666666667, "b": 532.6666666666666, "coord_origin": "1"}}, {"id": 668, "text": "a", "bbox": {"l": 418.3333333333333, "t": 527.0, "r": 422.3333333333333, "b": 532.0, "coord_origin": "1"}}, {"id": 669, "text": "style", "bbox": {"l": 427.0, "t": 525.0, "r": 445.0, "b": 534.0, "coord_origin": "1"}}, {"id": 670, "text": "is", "bbox": {"l": 449.3333333333333, "t": 525.0, "r": 455.3333333333333, "b": 532.0, "coord_origin": "1"}}, {"id": 671, "text": "randomly", "bbox": {"l": 459.6666666666667, "t": 525.0, "r": 497.3333333333333, "b": 534.0, "coord_origin": "1"}}, {"id": 672, "text": "selected", "bbox": {"l": 502.0, "t": 525.0, "r": 533.3333333333334, "b": 532.0, "coord_origin": "1"}}, {"id": 673, "text": "to", "bbox": {"l": 537.6666666666666, "t": 526.0, "r": 545.0, "b": 532.0, "coord_origin": "1"}}, {"id": 674, "text": "format", "bbox": {"l": 309.3333333333333, "t": 536.3333333333334, "r": 335.0, "b": 543.3333333333334, "coord_origin": "1"}}, {"id": 675, "text": "the", "bbox": {"l": 338.0, "t": 536.3333333333334, "r": 349.6666666666667, "b": 543.3333333333334, "coord_origin": "1"}}, {"id": 676, "text": "appearance", "bbox": {"l": 352.6666666666667, "t": 538.6666666666666, "r": 397.0, "b": 545.6666666666666, "coord_origin": "1"}}, {"id": 677, "text": "of", "bbox": {"l": 400.0, "t": 536.3333333333334, "r": 408.6666666666667, "b": 543.3333333333334, "coord_origin": "1"}}, {"id": 678, "text": "the", "bbox": {"l": 411.0, "t": 536.6666666666666, "r": 422.3333333333333, "b": 543.3333333333334, "coord_origin": "1"}}, {"id": 679, "text": "synthesized", "bbox": {"l": 425.6666666666667, "t": 536.3333333333334, "r": 471.3333333333333, "b": 545.6666666666666, "coord_origin": "1"}}, {"id": 680, "text": "table.", "bbox": {"l": 474.6666666666667, "t": 536.3333333333334, "r": 495.3333333333333, "b": 543.3333333333334, "coord_origin": "1"}}, {"id": 681, "text": "5.", "bbox": {"l": 321.0, "t": 549.3333333333334, "r": 327.3333333333333, "b": 556.3333333333334, "coord_origin": "1"}}, {"id": 682, "text": "Render", "bbox": {"l": 335.6666666666667, "t": 549.3333333333334, "r": 364.3333333333333, "b": 556.3333333333334, "coord_origin": "1"}}, {"id": 683, "text": "the", "bbox": {"l": 368.3333333333333, "t": 549.3333333333334, "r": 379.6666666666667, "b": 556.3333333333334, "coord_origin": "1"}}, {"id": 684, "text": "complete", "bbox": {"l": 384.0, "t": 549.3333333333334, "r": 420.0, "b": 558.6666666666666, "coord_origin": "1"}}, {"id": 685, "text": "tables:", "bbox": {"l": 424.6666666666667, "t": 549.3333333333334, "r": 449.6666666666667, "b": 556.3333333333334, "coord_origin": "1"}}, {"id": 686, "text": "The", "bbox": {"l": 456.3333333333333, "t": 549.3333333333334, "r": 471.3333333333333, "b": 556.3333333333334, "coord_origin": "1"}}, {"id": 687, "text": "synthetic", "bbox": {"l": 475.6666666666667, "t": 549.3333333333334, "r": 511.0, "b": 558.3333333333334, "coord_origin": "1"}}, {"id": 688, "text": "table", "bbox": {"l": 515.3333333333334, "t": 549.3333333333334, "r": 534.3333333333334, "b": 556.3333333333334, "coord_origin": "1"}}, {"id": 689, "text": "is", "bbox": {"l": 538.6666666666666, "t": 549.3333333333334, "r": 544.6666666666666, "b": 556.3333333333334, "coord_origin": "1"}}, {"id": 690, "text": "finally", "bbox": {"l": 309.3333333333333, "t": 561.3333333333334, "r": 333.6666666666667, "b": 570.6666666666666, "coord_origin": "1"}}, {"id": 691, "text": "rendered", "bbox": {"l": 338.0, "t": 561.3333333333334, "r": 372.3333333333333, "b": 568.3333333333334, "coord_origin": "1"}}, {"id": 692, "text": "by", "bbox": {"l": 376.6666666666667, "t": 561.3333333333334, "r": 386.0, "b": 570.6666666666666, "coord_origin": "1"}}, {"id": 693, "text": "a", "bbox": {"l": 390.3333333333333, "t": 563.6666666666666, "r": 394.3333333333333, "b": 568.3333333333334, "coord_origin": "1"}}, {"id": 694, "text": "web", "bbox": {"l": 398.6666666666667, "t": 561.3333333333334, "r": 414.3333333333333, "b": 568.3333333333334, "coord_origin": "1"}}, {"id": 695, "text": "browser", "bbox": {"l": 418.6666666666667, "t": 561.3333333333334, "r": 450.3333333333333, "b": 568.3333333333334, "coord_origin": "1"}}, {"id": 696, "text": "engine", "bbox": {"l": 454.0, "t": 561.3333333333334, "r": 480.0, "b": 570.6666666666666, "coord_origin": "1"}}, {"id": 697, "text": "to", "bbox": {"l": 484.3333333333333, "t": 562.6666666666666, "r": 491.6666666666667, "b": 568.3333333333334, "coord_origin": "1"}}, {"id": 698, "text": "generate", "bbox": {"l": 495.6666666666667, "t": 562.6666666666666, "r": 529.0, "b": 570.6666666666666, "coord_origin": "1"}}, {"id": 699, "text": "the", "bbox": {"l": 533.3333333333334, "t": 561.3333333333334, "r": 544.6666666666666, "b": 568.3333333333334, "coord_origin": "1"}}, {"id": 700, "text": "bounding", "bbox": {"l": 309.0, "t": 573.3333333333334, "r": 346.0, "b": 582.6666666666666, "coord_origin": "1"}}, {"id": 701, "text": "boxes", "bbox": {"l": 349.0, "t": 573.3333333333334, "r": 371.6666666666667, "b": 580.3333333333334, "coord_origin": "1"}}, {"id": 702, "text": "for", "bbox": {"l": 375.0, "t": 573.3333333333334, "r": 386.0, "b": 580.3333333333334, "coord_origin": "1"}}, {"id": 703, "text": "each", "bbox": {"l": 388.6666666666667, "t": 573.3333333333334, "r": 406.3333333333333, "b": 580.3333333333334, "coord_origin": "1"}}, {"id": 704, "text": "table", "bbox": {"l": 409.3333333333333, "t": 573.3333333333334, "r": 428.0, "b": 580.3333333333334, "coord_origin": "1"}}, {"id": 705, "text": "cell.", "bbox": {"l": 431.0, "t": 573.3333333333334, "r": 447.0, "b": 580.3333333333334, "coord_origin": "1"}}, {"id": 706, "text": "A", "bbox": {"l": 451.3333333333333, "t": 573.6666666666666, "r": 457.6666666666667, "b": 580.3333333333334, "coord_origin": "1"}}, {"id": 707, "text": "batching", "bbox": {"l": 460.6666666666667, "t": 573.3333333333334, "r": 494.6666666666667, "b": 582.6666666666666, "coord_origin": "1"}}, {"id": 708, "text": "technique", "bbox": {"l": 497.6666666666667, "t": 573.3333333333334, "r": 535.6666666666666, "b": 582.6666666666666, "coord_origin": "1"}}, {"id": 709, "text": "is", "bbox": {"l": 538.6666666666666, "t": 573.3333333333334, "r": 544.6666666666666, "b": 580.3333333333334, "coord_origin": "1"}}, {"id": 710, "text": "utilized", "bbox": {"l": 309.0, "t": 585.3333333333334, "r": 338.3333333333333, "b": 592.3333333333334, "coord_origin": "1"}}, {"id": 711, "text": "to", "bbox": {"l": 342.3333333333333, "t": 586.6666666666666, "r": 349.3333333333333, "b": 592.3333333333334, "coord_origin": "1"}}, {"id": 712, "text": "optimize", "bbox": {"l": 353.3333333333333, "t": 585.3333333333334, "r": 387.3333333333333, "b": 594.6666666666666, "coord_origin": "1"}}, {"id": 713, "text": "the", "bbox": {"l": 391.3333333333333, "t": 585.3333333333334, "r": 402.6666666666667, "b": 592.3333333333334, "coord_origin": "1"}}, {"id": 714, "text": "runtime", "bbox": {"l": 406.6666666666667, "t": 585.3333333333334, "r": 437.0, "b": 592.3333333333334, "coord_origin": "1"}}, {"id": 715, "text": "overhead", "bbox": {"l": 440.6666666666667, "t": 585.3333333333334, "r": 476.3333333333333, "b": 592.3333333333334, "coord_origin": "1"}}, {"id": 716, "text": "of", "bbox": {"l": 480.3333333333333, "t": 585.3333333333334, "r": 488.6666666666667, "b": 592.3333333333334, "coord_origin": "1"}}, {"id": 717, "text": "the", "bbox": {"l": 492.0, "t": 585.3333333333334, "r": 503.3333333333333, "b": 592.3333333333334, "coord_origin": "1"}}, {"id": 718, "text": "rendering", "bbox": {"l": 507.0, "t": 585.3333333333334, "r": 544.6666666666666, "b": 594.6666666666666, "coord_origin": "1"}}, {"id": 719, "text": "process.", "bbox": {"l": 309.0, "t": 599.6666666666666, "r": 340.3333333333333, "b": 606.6666666666666, "coord_origin": "1"}}, {"id": 720, "text": "2.", "bbox": {"l": 309.0, "t": 622.0, "r": 317.3333333333333, "b": 630.3333333333334, "coord_origin": "1"}}, {"id": 721, "text": "Prediction", "bbox": {"l": 323.6666666666667, "t": 622.0, "r": 376.3333333333333, "b": 630.3333333333334, "coord_origin": "1"}}, {"id": 722, "text": "post-processing", "bbox": {"l": 382.6666666666667, "t": 622.0, "r": 461.0, "b": 632.6666666666666, "coord_origin": "1"}}, {"id": 723, "text": "for", "bbox": {"l": 467.0, "t": 622.0, "r": 481.6666666666667, "b": 630.3333333333334, "coord_origin": "1"}}, {"id": 724, "text": "PDF", "bbox": {"l": 487.6666666666667, "t": 622.0, "r": 510.3333333333333, "b": 630.3333333333334, "coord_origin": "1"}}, {"id": 725, "text": "docu-", "bbox": {"l": 516.6666666666666, "t": 622.0, "r": 544.6666666666666, "b": 630.3333333333334, "coord_origin": "1"}}, {"id": 726, "text": "ments", "bbox": {"l": 327.0, "t": 636.6666666666666, "r": 357.0, "b": 644.3333333333334, "coord_origin": "1"}}, {"id": 727, "text": "Although", "bbox": {"l": 321.0, "t": 657.0, "r": 358.0, "b": 666.0, "coord_origin": "1"}}, {"id": 728, "text": "TableFormer", "bbox": {"l": 360.3333333333333, "t": 657.0, "r": 411.3333333333333, "b": 664.0, "coord_origin": "1"}}, {"id": 729, "text": "can", "bbox": {"l": 413.3333333333333, "t": 659.0, "r": 426.6666666666667, "b": 664.0, "coord_origin": "1"}}, {"id": 730, "text": "predict", "bbox": {"l": 429.3333333333333, "t": 657.0, "r": 456.3333333333333, "b": 666.0, "coord_origin": "1"}}, {"id": 731, "text": "the", "bbox": {"l": 459.0, "t": 657.0, "r": 470.3333333333333, "b": 664.0, "coord_origin": "1"}}, {"id": 732, "text": "table", "bbox": {"l": 473.0, "t": 657.0, "r": 491.6666666666667, "b": 664.0, "coord_origin": "1"}}, {"id": 733, "text": "structure", "bbox": {"l": 494.3333333333333, "t": 658.3333333333334, "r": 528.3333333333334, "b": 664.0, "coord_origin": "1"}}, {"id": 734, "text": "and", "bbox": {"l": 531.0, "t": 657.0, "r": 544.6666666666666, "b": 664.0, "coord_origin": "1"}}, {"id": 735, "text": "the", "bbox": {"l": 309.0, "t": 669.0, "r": 320.6666666666667, "b": 676.0, "coord_origin": "1"}}, {"id": 736, "text": "bounding", "bbox": {"l": 323.6666666666667, "t": 669.0, "r": 361.0, "b": 678.0, "coord_origin": "1"}}, {"id": 737, "text": "boxes", "bbox": {"l": 364.0, "t": 669.0, "r": 386.3333333333333, "b": 676.0, "coord_origin": "1"}}, {"id": 738, "text": "for", "bbox": {"l": 389.6666666666667, "t": 669.0, "r": 401.0, "b": 676.0, "coord_origin": "1"}}, {"id": 739, "text": "tables", "bbox": {"l": 403.6666666666667, "t": 669.0, "r": 426.3333333333333, "b": 676.0, "coord_origin": "1"}}, {"id": 740, "text": "recognized", "bbox": {"l": 429.3333333333333, "t": 669.0, "r": 472.3333333333333, "b": 678.0, "coord_origin": "1"}}, {"id": 741, "text": "inside", "bbox": {"l": 475.6666666666667, "t": 669.0, "r": 498.6666666666667, "b": 676.0, "coord_origin": "1"}}, {"id": 742, "text": "PDF", "bbox": {"l": 502.0, "t": 669.0, "r": 520.0, "b": 676.0, "coord_origin": "1"}}, {"id": 743, "text": "docu-", "bbox": {"l": 522.6666666666666, "t": 669.0, "r": 544.6666666666666, "b": 676.0, "coord_origin": "1"}}, {"id": 744, "text": "ments,", "bbox": {"l": 309.0, "t": 682.3333333333334, "r": 334.6666666666667, "b": 688.6666666666666, "coord_origin": "1"}}, {"id": 745, "text": "this", "bbox": {"l": 338.6666666666667, "t": 681.0, "r": 352.3333333333333, "b": 688.0, "coord_origin": "1"}}, {"id": 746, "text": "is", "bbox": {"l": 356.0, "t": 681.0, "r": 361.6666666666667, "b": 688.0, "coord_origin": "1"}}, {"id": 747, "text": "not", "bbox": {"l": 365.3333333333333, "t": 682.3333333333334, "r": 377.3333333333333, "b": 688.0, "coord_origin": "1"}}, {"id": 748, "text": "enough", "bbox": {"l": 381.0, "t": 681.0, "r": 409.6666666666667, "b": 690.0, "coord_origin": "1"}}, {"id": 749, "text": "when", "bbox": {"l": 413.3333333333333, "t": 681.0, "r": 434.3333333333333, "b": 688.0, "coord_origin": "1"}}, {"id": 750, "text": "a", "bbox": {"l": 434.6666666666667, "t": 679.6666666666666, "r": 438.6666666666667, "b": 691.6666666666666, "coord_origin": "1"}}, {"id": 751, "text": "full", "bbox": {"l": 445.3333333333333, "t": 681.0, "r": 458.3333333333333, "b": 688.0, "coord_origin": "1"}}, {"id": 752, "text": "reconstruction", "bbox": {"l": 462.0, "t": 681.0, "r": 518.3333333333334, "b": 688.0, "coord_origin": "1"}}, {"id": 753, "text": "of", "bbox": {"l": 521.6666666666666, "t": 681.0, "r": 530.3333333333334, "b": 688.0, "coord_origin": "1"}}, {"id": 754, "text": "the", "bbox": {"l": 533.3333333333334, "t": 681.0, "r": 544.6666666666666, "b": 688.0, "coord_origin": "1"}}, {"id": 755, "text": "original", "bbox": {"l": 309.0, "t": 693.0, "r": 339.3333333333333, "b": 702.0, "coord_origin": "1"}}, {"id": 756, "text": "table", "bbox": {"l": 342.6666666666667, "t": 693.0, "r": 361.3333333333333, "b": 700.0, "coord_origin": "1"}}, {"id": 757, "text": "is", "bbox": {"l": 365.0, "t": 693.0, "r": 370.6666666666667, "b": 700.0, "coord_origin": "1"}}, {"id": 758, "text": "required.", "bbox": {"l": 374.0, "t": 693.0, "r": 408.6666666666667, "b": 702.0, "coord_origin": "1"}}, {"id": 759, "text": "This", "bbox": {"l": 413.0, "t": 693.0, "r": 430.3333333333333, "b": 700.0, "coord_origin": "1"}}, {"id": 760, "text": "happens", "bbox": {"l": 433.6666666666667, "t": 693.0, "r": 465.6666666666667, "b": 702.0, "coord_origin": "1"}}, {"id": 761, "text": "mainly", "bbox": {"l": 469.0, "t": 693.0, "r": 495.6666666666667, "b": 702.0, "coord_origin": "1"}}, {"id": 762, "text": "due", "bbox": {"l": 499.0, "t": 693.0, "r": 512.6666666666666, "b": 700.0, "coord_origin": "1"}}, {"id": 763, "text": "the", "bbox": {"l": 516.3333333333334, "t": 693.0, "r": 527.6666666666666, "b": 700.0, "coord_origin": "1"}}, {"id": 764, "text": "fol-", "bbox": {"l": 531.0, "t": 693.0, "r": 544.6666666666666, "b": 700.0, "coord_origin": "1"}}, {"id": 765, "text": "lowing", "bbox": {"l": 309.3333333333333, "t": 705.0, "r": 336.0, "b": 714.0, "coord_origin": "1"}}, {"id": 766, "text": "reasons:", "bbox": {"l": 339.0, "t": 707.0, "r": 370.6666666666667, "b": 712.0, "coord_origin": "1"}}], "predictions": {"layout": {"clusters": [{"id": 0, "label": "Section-header", "bbox": {"l": 132.81927490234375, "t": 109.81901550292969, "r": 465.6957702636719, "b": 135.33333333333337, "coord_origin": "1"}, "confidence": 0.6151334643363953, "cells": [{"id": 0, "text": "TableFormer:", "bbox": {"l": 133.0, "t": 110.0, "r": 203.0, "b": 118.66666666666663, "coord_origin": "1"}}, {"id": 1, "text": "Table", "bbox": {"l": 207.66666666666666, "t": 110.0, "r": 235.33333333333334, "b": 118.66666666666663, "coord_origin": "1"}}, {"id": 2, "text": "Structure", "bbox": {"l": 239.0, "t": 110.0, "r": 287.3333333333333, "b": 118.66666666666663, "coord_origin": "1"}}, {"id": 3, "text": "Understanding", "bbox": {"l": 290.6666666666667, "t": 110.0, "r": 366.6666666666667, "b": 121.0, "coord_origin": "1"}}, {"id": 4, "text": "with", "bbox": {"l": 370.3333333333333, "t": 110.0, "r": 392.3333333333333, "b": 118.66666666666663, "coord_origin": "1"}}, {"id": 5, "text": "Transformers", "bbox": {"l": 395.6666666666667, "t": 110.0, "r": 465.0, "b": 118.66666666666663, "coord_origin": "1"}}, {"id": 6, "text": "Supplementary", "bbox": {"l": 220.66666666666666, "t": 121.66666666666663, "r": 315.6666666666667, "b": 135.33333333333337, "coord_origin": "1"}}, {"id": 7, "text": "Material", "bbox": {"l": 321.6666666666667, "t": 121.66666666666663, "r": 374.6666666666667, "b": 132.33333333333337, "coord_origin": "1"}}]}, {"id": 1, "label": "Section-header", "bbox": {"l": 49.808494567871094, "t": 160.33333333333337, "r": 175.76251220703125, "b": 171.59271240234375, "coord_origin": "1"}, "confidence": 0.9245885610580444, "cells": [{"id": 8, "text": "1.", "bbox": {"l": 51.0, "t": 160.66666666666663, "r": 58.666666666666664, "b": 169.0, "coord_origin": "1"}}, {"id": 9, "text": "Details", "bbox": {"l": 62.333333333333336, "t": 160.33333333333337, "r": 97.0, "b": 169.0, "coord_origin": "1"}}, {"id": 10, "text": "on", "bbox": {"l": 100.33333333333333, "t": 163.0, "r": 112.66666666666667, "b": 169.0, "coord_origin": "1"}}, {"id": 11, "text": "the", "bbox": {"l": 116.0, "t": 160.66666666666663, "r": 131.66666666666666, "b": 169.0, "coord_origin": "1"}}, {"id": 12, "text": "datasets", "bbox": {"l": 135.0, "t": 160.66666666666663, "r": 175.66666666666666, "b": 169.0, "coord_origin": "1"}}]}, {"id": 2, "label": "Section-header", "bbox": {"l": 49.78814697265625, "t": 180.33333333333337, "r": 150.2134552001953, "b": 190.48927307128906, "coord_origin": "1"}, "confidence": 0.9166122674942017, "cells": [{"id": 13, "text": "1.1.", "bbox": {"l": 51.0, "t": 180.33333333333337, "r": 66.0, "b": 188.33333333333337, "coord_origin": "1"}}, {"id": 14, "text": "Data", "bbox": {"l": 69.66666666666667, "t": 180.33333333333337, "r": 91.33333333333333, "b": 188.33333333333337, "coord_origin": "1"}}, {"id": 15, "text": "preparation", "bbox": {"l": 94.66666666666667, "t": 180.33333333333337, "r": 150.0, "b": 190.33333333333337, "coord_origin": "1"}}]}, {"id": 3, "label": "Text", "bbox": {"l": 49.627410888671875, "t": 198.0, "r": 286.6666666666667, "b": 388.20391845703125, "coord_origin": "1"}, "confidence": 0.9902494549751282, "cells": [{"id": 16, "text": "As", "bbox": {"l": 62.333333333333336, "t": 199.66666666666663, "r": 72.66666666666667, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 17, "text": "a", "bbox": {"l": 74.0, "t": 198.0, "r": 78.0, "b": 210.0, "coord_origin": "1"}}, {"id": 18, "text": "first", "bbox": {"l": 84.33333333333333, "t": 199.33333333333337, "r": 99.0, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 19, "text": "step", "bbox": {"l": 102.66666666666667, "t": 200.66666666666663, "r": 118.0, "b": 208.66666666666663, "coord_origin": "1"}}, {"id": 20, "text": "of", "bbox": {"l": 121.66666666666667, "t": 199.33333333333337, "r": 130.33333333333334, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 21, "text": "our", "bbox": {"l": 133.33333333333334, "t": 201.66666666666663, "r": 146.33333333333334, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 22, "text": "data", "bbox": {"l": 149.33333333333334, "t": 199.33333333333337, "r": 165.66666666666666, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 23, "text": "preparation", "bbox": {"l": 169.33333333333334, "t": 199.33333333333337, "r": 214.0, "b": 208.66666666666663, "coord_origin": "1"}}, {"id": 24, "text": "process,", "bbox": {"l": 217.66666666666666, "t": 201.66666666666663, "r": 249.33333333333334, "b": 208.66666666666663, "coord_origin": "1"}}, {"id": 25, "text": "we", "bbox": {"l": 253.33333333333334, "t": 201.66666666666663, "r": 264.3333333333333, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 26, "text": "have", "bbox": {"l": 268.3333333333333, "t": 199.33333333333337, "r": 286.0, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 27, "text": "calculated", "bbox": {"l": 50.333333333333336, "t": 211.33333333333337, "r": 90.0, "b": 218.33333333333337, "coord_origin": "1"}}, {"id": 28, "text": "statistics", "bbox": {"l": 94.33333333333333, "t": 211.33333333333337, "r": 128.0, "b": 218.33333333333337, "coord_origin": "1"}}, {"id": 29, "text": "over", "bbox": {"l": 132.0, "t": 213.66666666666663, "r": 149.33333333333334, "b": 218.33333333333337, "coord_origin": "1"}}, {"id": 30, "text": "the", "bbox": {"l": 153.0, "t": 211.33333333333337, "r": 164.66666666666666, "b": 218.33333333333337, "coord_origin": "1"}}, {"id": 31, "text": "datasets", "bbox": {"l": 168.66666666666666, "t": 211.33333333333337, "r": 199.66666666666666, "b": 218.33333333333337, "coord_origin": "1"}}, {"id": 32, "text": "across", "bbox": {"l": 204.0, "t": 213.66666666666663, "r": 228.0, "b": 218.33333333333337, "coord_origin": "1"}}, {"id": 33, "text": "the", "bbox": {"l": 232.33333333333334, "t": 211.33333333333337, "r": 244.0, "b": 218.33333333333337, "coord_origin": "1"}}, {"id": 34, "text": "following", "bbox": {"l": 248.33333333333334, "t": 211.33333333333337, "r": 286.0, "b": 220.66666666666663, "coord_origin": "1"}}, {"id": 35, "text": "dimensions:", "bbox": {"l": 50.333333333333336, "t": 223.33333333333337, "r": 97.33333333333333, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 36, "text": "(1)", "bbox": {"l": 102.33333333333333, "t": 223.66666666666663, "r": 113.0, "b": 231.66666666666663, "coord_origin": "1"}}, {"id": 37, "text": "table", "bbox": {"l": 116.66666666666667, "t": 223.33333333333337, "r": 135.33333333333334, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 38, "text": "size", "bbox": {"l": 138.66666666666666, "t": 223.33333333333337, "r": 153.33333333333334, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 39, "text": "measured", "bbox": {"l": 157.0, "t": 223.33333333333337, "r": 194.33333333333334, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 40, "text": "in", "bbox": {"l": 198.0, "t": 223.33333333333337, "r": 205.0, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 41, "text": "the", "bbox": {"l": 208.33333333333334, "t": 223.33333333333337, "r": 220.0, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 42, "text": "number", "bbox": {"l": 223.33333333333334, "t": 223.33333333333337, "r": 253.33333333333334, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 43, "text": "of", "bbox": {"l": 256.3333333333333, "t": 223.33333333333337, "r": 265.0, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 44, "text": "rows", "bbox": {"l": 267.3333333333333, "t": 225.66666666666663, "r": 286.0, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 45, "text": "and", "bbox": {"l": 50.333333333333336, "t": 235.33333333333337, "r": 64.0, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 46, "text": "columns,", "bbox": {"l": 67.66666666666667, "t": 235.33333333333337, "r": 103.66666666666667, "b": 243.33333333333337, "coord_origin": "1"}}, {"id": 47, "text": "(2)", "bbox": {"l": 108.0, "t": 235.33333333333337, "r": 118.66666666666667, "b": 243.66666666666663, "coord_origin": "1"}}, {"id": 48, "text": "complexity", "bbox": {"l": 122.66666666666667, "t": 235.33333333333337, "r": 166.66666666666666, "b": 244.66666666666663, "coord_origin": "1"}}, {"id": 49, "text": "of", "bbox": {"l": 170.66666666666666, "t": 235.33333333333337, "r": 179.0, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 50, "text": "the", "bbox": {"l": 182.33333333333334, "t": 235.33333333333337, "r": 193.66666666666666, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 51, "text": "table,", "bbox": {"l": 197.66666666666666, "t": 235.33333333333337, "r": 218.66666666666666, "b": 243.33333333333337, "coord_origin": "1"}}, {"id": 52, "text": "(3)", "bbox": {"l": 223.0, "t": 235.33333333333337, "r": 234.0, "b": 243.66666666666663, "coord_origin": "1"}}, {"id": 53, "text": "strictness", "bbox": {"l": 238.0, "t": 235.33333333333337, "r": 274.3333333333333, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 54, "text": "of", "bbox": {"l": 278.3333333333333, "t": 235.33333333333337, "r": 286.6666666666667, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 55, "text": "the", "bbox": {"l": 50.333333333333336, "t": 247.33333333333337, "r": 62.0, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 56, "text": "provided", "bbox": {"l": 65.0, "t": 247.33333333333337, "r": 99.66666666666667, "b": 256.66666666666674, "coord_origin": "1"}}, {"id": 57, "text": "HTML", "bbox": {"l": 103.0, "t": 247.33333333333337, "r": 130.66666666666666, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 58, "text": "structure", "bbox": {"l": 133.66666666666666, "t": 248.66666666666663, "r": 167.66666666666666, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 59, "text": "and", "bbox": {"l": 170.66666666666666, "t": 247.33333333333337, "r": 184.66666666666666, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 60, "text": "(4)", "bbox": {"l": 187.66666666666666, "t": 247.33333333333337, "r": 198.66666666666666, "b": 255.66666666666663, "coord_origin": "1"}}, {"id": 61, "text": "completeness", "bbox": {"l": 201.66666666666666, "t": 247.33333333333337, "r": 255.0, "b": 256.66666666666674, "coord_origin": "1"}}, {"id": 62, "text": "(i.e.", "bbox": {"l": 258.3333333333333, "t": 247.33333333333337, "r": 272.6666666666667, "b": 255.66666666666663, "coord_origin": "1"}}, {"id": 63, "text": "no", "bbox": {"l": 276.6666666666667, "t": 249.66666666666663, "r": 286.0, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 64, "text": "omitted", "bbox": {"l": 50.333333333333336, "t": 259.33333333333326, "r": 80.0, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 65, "text": "bounding", "bbox": {"l": 82.66666666666667, "t": 259.33333333333326, "r": 120.0, "b": 268.66666666666674, "coord_origin": "1"}}, {"id": 66, "text": "boxes).", "bbox": {"l": 122.33333333333333, "t": 259.33333333333326, "r": 150.33333333333334, "b": 267.66666666666674, "coord_origin": "1"}}, {"id": 67, "text": "A", "bbox": {"l": 155.0, "t": 259.66666666666674, "r": 158.0, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 68, "text": "table", "bbox": {"l": 163.66666666666666, "t": 259.33333333333326, "r": 182.33333333333334, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 69, "text": "is", "bbox": {"l": 185.0, "t": 259.33333333333326, "r": 191.0, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 70, "text": "considered", "bbox": {"l": 193.33333333333334, "t": 259.33333333333326, "r": 236.0, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 71, "text": "to", "bbox": {"l": 239.0, "t": 260.66666666666674, "r": 246.0, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 72, "text": "be", "bbox": {"l": 248.66666666666666, "t": 259.33333333333326, "r": 257.3333333333333, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 73, "text": "simple", "bbox": {"l": 260.0, "t": 259.33333333333326, "r": 286.0, "b": 268.66666666666674, "coord_origin": "1"}}, {"id": 74, "text": "if", "bbox": {"l": 50.333333333333336, "t": 271.33333333333326, "r": 56.666666666666664, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 75, "text": "it", "bbox": {"l": 59.0, "t": 271.33333333333326, "r": 63.666666666666664, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 76, "text": "does", "bbox": {"l": 66.66666666666667, "t": 271.33333333333326, "r": 84.66666666666667, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 77, "text": "not", "bbox": {"l": 87.66666666666667, "t": 272.66666666666674, "r": 99.66666666666667, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 78, "text": "contain", "bbox": {"l": 102.66666666666667, "t": 271.33333333333326, "r": 131.66666666666666, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 79, "text": "row", "bbox": {"l": 134.66666666666666, "t": 273.66666666666674, "r": 149.33333333333334, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 80, "text": "spans", "bbox": {"l": 152.33333333333334, "t": 273.66666666666674, "r": 174.0, "b": 280.6666666666667, "coord_origin": "1"}}, {"id": 81, "text": "or", "bbox": {"l": 177.0, "t": 273.66666666666674, "r": 185.0, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 82, "text": "column", "bbox": {"l": 187.66666666666666, "t": 271.33333333333326, "r": 217.0, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 83, "text": "spans.", "bbox": {"l": 220.33333333333334, "t": 273.66666666666674, "r": 244.0, "b": 280.6666666666667, "coord_origin": "1"}}, {"id": 84, "text": "Addition-", "bbox": {"l": 248.0, "t": 271.33333333333326, "r": 286.0, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 85, "text": "ally,", "bbox": {"l": 50.333333333333336, "t": 283.0, "r": 66.33333333333333, "b": 292.0, "coord_origin": "1"}}, {"id": 86, "text": "a", "bbox": {"l": 69.33333333333333, "t": 285.0, "r": 73.33333333333333, "b": 290.0, "coord_origin": "1"}}, {"id": 87, "text": "table", "bbox": {"l": 76.0, "t": 283.0, "r": 94.66666666666667, "b": 290.0, "coord_origin": "1"}}, {"id": 88, "text": "has", "bbox": {"l": 97.66666666666667, "t": 283.0, "r": 110.33333333333333, "b": 290.0, "coord_origin": "1"}}, {"id": 89, "text": "a", "bbox": {"l": 113.0, "t": 285.0, "r": 117.0, "b": 290.0, "coord_origin": "1"}}, {"id": 90, "text": "strict", "bbox": {"l": 120.0, "t": 283.0, "r": 139.0, "b": 290.0, "coord_origin": "1"}}, {"id": 91, "text": "HTML", "bbox": {"l": 142.0, "t": 283.0, "r": 169.66666666666666, "b": 290.0, "coord_origin": "1"}}, {"id": 92, "text": "structure", "bbox": {"l": 172.33333333333334, "t": 284.3333333333333, "r": 206.33333333333334, "b": 290.0, "coord_origin": "1"}}, {"id": 93, "text": "if", "bbox": {"l": 209.33333333333334, "t": 283.0, "r": 215.66666666666666, "b": 290.0, "coord_origin": "1"}}, {"id": 94, "text": "every", "bbox": {"l": 217.33333333333334, "t": 285.0, "r": 238.66666666666666, "b": 292.0, "coord_origin": "1"}}, {"id": 95, "text": "row", "bbox": {"l": 241.33333333333334, "t": 285.0, "r": 256.0, "b": 290.0, "coord_origin": "1"}}, {"id": 96, "text": "has", "bbox": {"l": 259.0, "t": 283.0, "r": 271.6666666666667, "b": 290.0, "coord_origin": "1"}}, {"id": 97, "text": "the", "bbox": {"l": 274.3333333333333, "t": 283.0, "r": 286.0, "b": 290.0, "coord_origin": "1"}}, {"id": 98, "text": "same", "bbox": {"l": 50.333333333333336, "t": 297.0, "r": 70.0, "b": 302.0, "coord_origin": "1"}}, {"id": 99, "text": "number", "bbox": {"l": 73.66666666666667, "t": 295.0, "r": 103.66666666666667, "b": 302.0, "coord_origin": "1"}}, {"id": 100, "text": "of", "bbox": {"l": 106.66666666666667, "t": 295.0, "r": 115.33333333333333, "b": 302.0, "coord_origin": "1"}}, {"id": 101, "text": "columns", "bbox": {"l": 117.66666666666667, "t": 295.0, "r": 150.66666666666666, "b": 302.0, "coord_origin": "1"}}, {"id": 102, "text": "after", "bbox": {"l": 154.0, "t": 295.0, "r": 172.0, "b": 302.0, "coord_origin": "1"}}, {"id": 103, "text": "taking", "bbox": {"l": 175.0, "t": 295.0, "r": 199.33333333333334, "b": 304.0, "coord_origin": "1"}}, {"id": 104, "text": "into", "bbox": {"l": 202.66666666666666, "t": 295.0, "r": 217.66666666666666, "b": 302.0, "coord_origin": "1"}}, {"id": 105, "text": "account", "bbox": {"l": 220.66666666666666, "t": 296.3333333333333, "r": 251.0, "b": 302.0, "coord_origin": "1"}}, {"id": 106, "text": "any", "bbox": {"l": 254.33333333333334, "t": 297.0, "r": 268.0, "b": 304.0, "coord_origin": "1"}}, {"id": 107, "text": "row", "bbox": {"l": 271.3333333333333, "t": 297.0, "r": 286.0, "b": 302.0, "coord_origin": "1"}}, {"id": 108, "text": "or", "bbox": {"l": 50.333333333333336, "t": 309.0, "r": 58.333333333333336, "b": 314.0, "coord_origin": "1"}}, {"id": 109, "text": "column", "bbox": {"l": 61.333333333333336, "t": 307.0, "r": 90.66666666666667, "b": 314.0, "coord_origin": "1"}}, {"id": 110, "text": "spans.", "bbox": {"l": 94.66666666666667, "t": 309.0, "r": 118.0, "b": 316.0, "coord_origin": "1"}}, {"id": 111, "text": "Therefore", "bbox": {"l": 123.33333333333333, "t": 307.0, "r": 162.0, "b": 314.0, "coord_origin": "1"}}, {"id": 112, "text": "a", "bbox": {"l": 165.66666666666666, "t": 309.0, "r": 169.66666666666666, "b": 314.0, "coord_origin": "1"}}, {"id": 113, "text": "strict", "bbox": {"l": 173.33333333333334, "t": 307.0, "r": 192.33333333333334, "b": 314.0, "coord_origin": "1"}}, {"id": 114, "text": "HTML", "bbox": {"l": 196.0, "t": 307.0, "r": 223.66666666666666, "b": 314.0, "coord_origin": "1"}}, {"id": 115, "text": "structure", "bbox": {"l": 227.33333333333334, "t": 308.3333333333333, "r": 261.3333333333333, "b": 314.0, "coord_origin": "1"}}, {"id": 116, "text": "looks", "bbox": {"l": 265.0, "t": 307.0, "r": 286.0, "b": 314.0, "coord_origin": "1"}}, {"id": 117, "text": "always", "bbox": {"l": 50.333333333333336, "t": 319.0, "r": 77.33333333333333, "b": 328.0, "coord_origin": "1"}}, {"id": 118, "text": "rectangular.", "bbox": {"l": 80.66666666666667, "t": 319.0, "r": 126.33333333333333, "b": 328.0, "coord_origin": "1"}}, {"id": 119, "text": "However,", "bbox": {"l": 131.66666666666666, "t": 319.0, "r": 168.66666666666666, "b": 326.6666666666667, "coord_origin": "1"}}, {"id": 120, "text": "HTML", "bbox": {"l": 172.33333333333334, "t": 319.0, "r": 200.0, "b": 326.0, "coord_origin": "1"}}, {"id": 121, "text": "is", "bbox": {"l": 203.66666666666666, "t": 319.0, "r": 209.33333333333334, "b": 326.0, "coord_origin": "1"}}, {"id": 122, "text": "a", "bbox": {"l": 211.33333333333334, "t": 317.6666666666667, "r": 214.33333333333334, "b": 329.3333333333333, "coord_origin": "1"}}, {"id": 123, "text": "lenient", "bbox": {"l": 220.33333333333334, "t": 319.0, "r": 246.66666666666666, "b": 326.0, "coord_origin": "1"}}, {"id": 124, "text": "encoding", "bbox": {"l": 250.0, "t": 319.0, "r": 286.0, "b": 328.0, "coord_origin": "1"}}, {"id": 125, "text": "format,", "bbox": {"l": 50.666666666666664, "t": 331.0, "r": 78.66666666666667, "b": 338.6666666666667, "coord_origin": "1"}}, {"id": 126, "text": "i.e.", "bbox": {"l": 83.33333333333333, "t": 331.0, "r": 94.66666666666667, "b": 338.0, "coord_origin": "1"}}, {"id": 127, "text": "tables", "bbox": {"l": 101.66666666666667, "t": 331.0, "r": 124.33333333333333, "b": 338.0, "coord_origin": "1"}}, {"id": 128, "text": "with", "bbox": {"l": 128.66666666666666, "t": 331.0, "r": 145.66666666666666, "b": 338.0, "coord_origin": "1"}}, {"id": 129, "text": "rows", "bbox": {"l": 149.66666666666666, "t": 333.0, "r": 168.33333333333334, "b": 338.0, "coord_origin": "1"}}, {"id": 130, "text": "of", "bbox": {"l": 172.33333333333334, "t": 331.0, "r": 181.0, "b": 338.0, "coord_origin": "1"}}, {"id": 131, "text": "different", "bbox": {"l": 184.33333333333334, "t": 331.0, "r": 217.66666666666666, "b": 338.0, "coord_origin": "1"}}, {"id": 132, "text": "sizes", "bbox": {"l": 222.0, "t": 331.0, "r": 240.66666666666666, "b": 338.0, "coord_origin": "1"}}, {"id": 133, "text": "might", "bbox": {"l": 245.0, "t": 331.0, "r": 267.6666666666667, "b": 340.0, "coord_origin": "1"}}, {"id": 134, "text": "still", "bbox": {"l": 271.6666666666667, "t": 331.0, "r": 286.0, "b": 338.0, "coord_origin": "1"}}, {"id": 135, "text": "be", "bbox": {"l": 50.333333333333336, "t": 343.0, "r": 59.0, "b": 350.0, "coord_origin": "1"}}, {"id": 136, "text": "regarded", "bbox": {"l": 62.666666666666664, "t": 343.0, "r": 96.66666666666667, "b": 352.0, "coord_origin": "1"}}, {"id": 137, "text": "as", "bbox": {"l": 100.33333333333333, "t": 345.0, "r": 108.0, "b": 350.0, "coord_origin": "1"}}, {"id": 138, "text": "correct", "bbox": {"l": 111.66666666666667, "t": 344.3333333333333, "r": 138.66666666666666, "b": 350.0, "coord_origin": "1"}}, {"id": 139, "text": "due", "bbox": {"l": 142.33333333333334, "t": 343.0, "r": 156.0, "b": 350.0, "coord_origin": "1"}}, {"id": 140, "text": "to", "bbox": {"l": 159.66666666666666, "t": 344.3333333333333, "r": 167.0, "b": 350.0, "coord_origin": "1"}}, {"id": 141, "text": "implicit", "bbox": {"l": 170.66666666666666, "t": 343.0, "r": 201.0, "b": 352.0, "coord_origin": "1"}}, {"id": 142, "text": "display", "bbox": {"l": 204.33333333333334, "t": 343.0, "r": 232.33333333333334, "b": 352.0, "coord_origin": "1"}}, {"id": 143, "text": "rules.", "bbox": {"l": 236.33333333333334, "t": 343.0, "r": 257.3333333333333, "b": 350.0, "coord_origin": "1"}}, {"id": 144, "text": "These", "bbox": {"l": 262.6666666666667, "t": 343.0, "r": 286.0, "b": 350.0, "coord_origin": "1"}}, {"id": 145, "text": "implicit", "bbox": {"l": 50.333333333333336, "t": 355.0, "r": 80.66666666666667, "b": 364.0, "coord_origin": "1"}}, {"id": 146, "text": "rules", "bbox": {"l": 84.33333333333333, "t": 355.0, "r": 103.33333333333333, "b": 362.0, "coord_origin": "1"}}, {"id": 147, "text": "leave", "bbox": {"l": 107.0, "t": 355.0, "r": 126.66666666666667, "b": 362.0, "coord_origin": "1"}}, {"id": 148, "text": "room", "bbox": {"l": 130.33333333333334, "t": 357.0, "r": 151.0, "b": 362.0, "coord_origin": "1"}}, {"id": 149, "text": "for", "bbox": {"l": 154.66666666666666, "t": 355.0, "r": 165.66666666666666, "b": 362.0, "coord_origin": "1"}}, {"id": 150, "text": "ambiguity,", "bbox": {"l": 169.0, "t": 355.0, "r": 210.66666666666666, "b": 364.0, "coord_origin": "1"}}, {"id": 151, "text": "which", "bbox": {"l": 214.66666666666666, "t": 355.0, "r": 238.33333333333334, "b": 362.0, "coord_origin": "1"}}, {"id": 152, "text": "we", "bbox": {"l": 242.0, "t": 357.0, "r": 252.66666666666666, "b": 362.0, "coord_origin": "1"}}, {"id": 153, "text": "want", "bbox": {"l": 256.6666666666667, "t": 356.3333333333333, "r": 275.3333333333333, "b": 362.0, "coord_origin": "1"}}, {"id": 154, "text": "to", "bbox": {"l": 279.0, "t": 356.3333333333333, "r": 286.0, "b": 362.0, "coord_origin": "1"}}, {"id": 155, "text": "avoid.", "bbox": {"l": 50.333333333333336, "t": 367.0, "r": 73.66666666666667, "b": 374.0, "coord_origin": "1"}}, {"id": 156, "text": "As", "bbox": {"l": 78.0, "t": 367.0, "r": 88.66666666666667, "b": 374.0, "coord_origin": "1"}}, {"id": 157, "text": "such,", "bbox": {"l": 92.0, "t": 367.0, "r": 112.0, "b": 374.6666666666667, "coord_origin": "1"}}, {"id": 158, "text": "we", "bbox": {"l": 115.66666666666667, "t": 369.0, "r": 126.33333333333333, "b": 374.0, "coord_origin": "1"}}, {"id": 159, "text": "prefer", "bbox": {"l": 129.66666666666666, "t": 367.0, "r": 153.33333333333334, "b": 376.0, "coord_origin": "1"}}, {"id": 160, "text": "to", "bbox": {"l": 156.33333333333334, "t": 368.3333333333333, "r": 163.33333333333334, "b": 374.0, "coord_origin": "1"}}, {"id": 161, "text": "have", "bbox": {"l": 166.33333333333334, "t": 367.0, "r": 184.33333333333334, "b": 374.0, "coord_origin": "1"}}, {"id": 162, "text": "\u201cstrict\u201d", "bbox": {"l": 187.66666666666666, "t": 367.0, "r": 215.66666666666666, "b": 374.0, "coord_origin": "1"}}, {"id": 163, "text": "tables,", "bbox": {"l": 219.0, "t": 367.0, "r": 244.0, "b": 374.6666666666667, "coord_origin": "1"}}, {"id": 164, "text": "i.e.", "bbox": {"l": 247.66666666666666, "t": 367.0, "r": 258.6666666666667, "b": 374.0, "coord_origin": "1"}}, {"id": 165, "text": "tables", "bbox": {"l": 263.3333333333333, "t": 367.0, "r": 286.0, "b": 374.0, "coord_origin": "1"}}, {"id": 166, "text": "where", "bbox": {"l": 50.333333333333336, "t": 379.0, "r": 74.0, "b": 386.0, "coord_origin": "1"}}, {"id": 167, "text": "every", "bbox": {"l": 77.0, "t": 381.0, "r": 98.0, "b": 388.0, "coord_origin": "1"}}, {"id": 168, "text": "row", "bbox": {"l": 101.33333333333333, "t": 381.0, "r": 116.0, "b": 386.0, "coord_origin": "1"}}, {"id": 169, "text": "has", "bbox": {"l": 119.0, "t": 379.0, "r": 131.66666666666666, "b": 386.0, "coord_origin": "1"}}, {"id": 170, "text": "exactly", "bbox": {"l": 134.66666666666666, "t": 379.0, "r": 162.66666666666666, "b": 388.0, "coord_origin": "1"}}, {"id": 171, "text": "the", "bbox": {"l": 166.0, "t": 379.0, "r": 177.66666666666666, "b": 386.0, "coord_origin": "1"}}, {"id": 172, "text": "same", "bbox": {"l": 180.66666666666666, "t": 381.0, "r": 200.66666666666666, "b": 386.0, "coord_origin": "1"}}, {"id": 173, "text": "length.", "bbox": {"l": 203.66666666666666, "t": 379.0, "r": 230.0, "b": 388.0, "coord_origin": "1"}}]}, {"id": 4, "label": "Text", "bbox": {"l": 49.640533447265625, "t": 390.59295654296875, "r": 286.6666666666667, "b": 627.3333333333334, "coord_origin": "1"}, "confidence": 0.987933337688446, "cells": [{"id": 174, "text": "We", "bbox": {"l": 62.333333333333336, "t": 391.0, "r": 74.66666666666667, "b": 398.0, "coord_origin": "1"}}, {"id": 175, "text": "have", "bbox": {"l": 80.0, "t": 391.0, "r": 97.66666666666667, "b": 398.0, "coord_origin": "1"}}, {"id": 176, "text": "developed", "bbox": {"l": 102.66666666666667, "t": 391.0, "r": 142.66666666666666, "b": 400.0, "coord_origin": "1"}}, {"id": 177, "text": "a", "bbox": {"l": 147.66666666666666, "t": 393.0, "r": 151.66666666666666, "b": 398.0, "coord_origin": "1"}}, {"id": 178, "text": "technique", "bbox": {"l": 156.66666666666666, "t": 391.0, "r": 194.66666666666666, "b": 400.0, "coord_origin": "1"}}, {"id": 179, "text": "that", "bbox": {"l": 200.0, "t": 391.0, "r": 214.33333333333334, "b": 398.0, "coord_origin": "1"}}, {"id": 180, "text": "tries", "bbox": {"l": 219.33333333333334, "t": 391.0, "r": 235.66666666666666, "b": 398.0, "coord_origin": "1"}}, {"id": 181, "text": "to", "bbox": {"l": 241.0, "t": 392.3333333333333, "r": 248.33333333333334, "b": 398.0, "coord_origin": "1"}}, {"id": 182, "text": "derive", "bbox": {"l": 253.0, "t": 391.0, "r": 277.0, "b": 398.0, "coord_origin": "1"}}, {"id": 183, "text": "a", "bbox": {"l": 282.3333333333333, "t": 393.0, "r": 286.3333333333333, "b": 398.0, "coord_origin": "1"}}, {"id": 184, "text": "missing", "bbox": {"l": 50.333333333333336, "t": 403.0, "r": 80.66666666666667, "b": 412.0, "coord_origin": "1"}}, {"id": 185, "text": "bounding", "bbox": {"l": 84.33333333333333, "t": 403.0, "r": 121.33333333333333, "b": 412.0, "coord_origin": "1"}}, {"id": 186, "text": "box", "bbox": {"l": 125.0, "t": 403.0, "r": 139.0, "b": 410.0, "coord_origin": "1"}}, {"id": 187, "text": "out", "bbox": {"l": 142.66666666666666, "t": 404.3333333333333, "r": 155.0, "b": 410.0, "coord_origin": "1"}}, {"id": 188, "text": "of", "bbox": {"l": 158.33333333333334, "t": 403.0, "r": 167.0, "b": 410.0, "coord_origin": "1"}}, {"id": 189, "text": "its", "bbox": {"l": 169.66666666666666, "t": 403.0, "r": 178.66666666666666, "b": 410.0, "coord_origin": "1"}}, {"id": 190, "text": "neighbors.", "bbox": {"l": 182.0, "t": 403.0, "r": 222.66666666666666, "b": 412.0, "coord_origin": "1"}}, {"id": 191, "text": "As", "bbox": {"l": 228.33333333333334, "t": 403.0, "r": 238.66666666666666, "b": 410.0, "coord_origin": "1"}}, {"id": 192, "text": "a", "bbox": {"l": 239.33333333333334, "t": 401.6666666666667, "r": 243.66666666666666, "b": 413.3333333333333, "coord_origin": "1"}}, {"id": 193, "text": "first", "bbox": {"l": 250.0, "t": 403.0, "r": 264.6666666666667, "b": 410.0, "coord_origin": "1"}}, {"id": 194, "text": "step,", "bbox": {"l": 268.3333333333333, "t": 404.3333333333333, "r": 285.6666666666667, "b": 412.0, "coord_origin": "1"}}, {"id": 195, "text": "we", "bbox": {"l": 50.333333333333336, "t": 417.0, "r": 61.333333333333336, "b": 422.0, "coord_origin": "1"}}, {"id": 196, "text": "use", "bbox": {"l": 64.33333333333333, "t": 417.0, "r": 76.66666666666667, "b": 422.0, "coord_origin": "1"}}, {"id": 197, "text": "the", "bbox": {"l": 79.66666666666667, "t": 415.0, "r": 91.0, "b": 422.0, "coord_origin": "1"}}, {"id": 198, "text": "annotation", "bbox": {"l": 94.0, "t": 415.0, "r": 135.33333333333334, "b": 422.0, "coord_origin": "1"}}, {"id": 199, "text": "data", "bbox": {"l": 138.0, "t": 415.0, "r": 154.33333333333334, "b": 422.0, "coord_origin": "1"}}, {"id": 200, "text": "to", "bbox": {"l": 156.66666666666666, "t": 416.3333333333333, "r": 164.0, "b": 422.0, "coord_origin": "1"}}, {"id": 201, "text": "generate", "bbox": {"l": 166.66666666666666, "t": 416.3333333333333, "r": 199.66666666666666, "b": 424.0, "coord_origin": "1"}}, {"id": 202, "text": "the", "bbox": {"l": 202.66666666666666, "t": 415.0, "r": 214.0, "b": 422.0, "coord_origin": "1"}}, {"id": 203, "text": "most", "bbox": {"l": 217.0, "t": 416.3333333333333, "r": 235.66666666666666, "b": 422.0, "coord_origin": "1"}}, {"id": 204, "text": "fine-grained", "bbox": {"l": 238.66666666666666, "t": 415.0, "r": 286.0, "b": 424.0, "coord_origin": "1"}}, {"id": 205, "text": "grid", "bbox": {"l": 50.333333333333336, "t": 427.0, "r": 65.66666666666667, "b": 436.0, "coord_origin": "1"}}, {"id": 206, "text": "that", "bbox": {"l": 69.33333333333333, "t": 427.0, "r": 83.33333333333333, "b": 434.0, "coord_origin": "1"}}, {"id": 207, "text": "covers", "bbox": {"l": 86.66666666666667, "t": 429.0, "r": 112.0, "b": 434.0, "coord_origin": "1"}}, {"id": 208, "text": "the", "bbox": {"l": 115.33333333333333, "t": 427.0, "r": 126.66666666666667, "b": 434.0, "coord_origin": "1"}}, {"id": 209, "text": "table", "bbox": {"l": 130.33333333333334, "t": 427.0, "r": 149.0, "b": 434.0, "coord_origin": "1"}}, {"id": 210, "text": "structure.", "bbox": {"l": 152.66666666666666, "t": 428.3333333333333, "r": 188.66666666666666, "b": 434.0, "coord_origin": "1"}}, {"id": 211, "text": "In", "bbox": {"l": 193.66666666666666, "t": 427.0, "r": 201.33333333333334, "b": 434.0, "coord_origin": "1"}}, {"id": 212, "text": "case", "bbox": {"l": 204.66666666666666, "t": 429.0, "r": 221.33333333333334, "b": 434.0, "coord_origin": "1"}}, {"id": 213, "text": "of", "bbox": {"l": 224.66666666666666, "t": 427.0, "r": 233.0, "b": 434.0, "coord_origin": "1"}}, {"id": 214, "text": "strict", "bbox": {"l": 235.66666666666666, "t": 427.0, "r": 255.0, "b": 434.0, "coord_origin": "1"}}, {"id": 215, "text": "HTML", "bbox": {"l": 258.3333333333333, "t": 427.0, "r": 286.0, "b": 434.0, "coord_origin": "1"}}, {"id": 216, "text": "tables,", "bbox": {"l": 50.333333333333336, "t": 439.0, "r": 75.33333333333333, "b": 446.6666666666667, "coord_origin": "1"}}, {"id": 217, "text": "all", "bbox": {"l": 79.66666666666667, "t": 439.0, "r": 88.66666666666667, "b": 446.0, "coord_origin": "1"}}, {"id": 218, "text": "grid", "bbox": {"l": 92.66666666666667, "t": 439.0, "r": 108.0, "b": 448.0, "coord_origin": "1"}}, {"id": 219, "text": "squares", "bbox": {"l": 112.0, "t": 441.0, "r": 141.33333333333334, "b": 448.0, "coord_origin": "1"}}, {"id": 220, "text": "are", "bbox": {"l": 145.0, "t": 441.0, "r": 156.33333333333334, "b": 446.0, "coord_origin": "1"}}, {"id": 221, "text": "associated", "bbox": {"l": 160.33333333333334, "t": 439.0, "r": 200.66666666666666, "b": 446.0, "coord_origin": "1"}}, {"id": 222, "text": "with", "bbox": {"l": 204.66666666666666, "t": 439.0, "r": 221.66666666666666, "b": 446.0, "coord_origin": "1"}}, {"id": 223, "text": "some", "bbox": {"l": 225.66666666666666, "t": 441.0, "r": 245.66666666666666, "b": 446.0, "coord_origin": "1"}}, {"id": 224, "text": "table", "bbox": {"l": 249.66666666666666, "t": 439.0, "r": 268.3333333333333, "b": 446.0, "coord_origin": "1"}}, {"id": 225, "text": "cell", "bbox": {"l": 272.0, "t": 439.0, "r": 286.0, "b": 446.0, "coord_origin": "1"}}, {"id": 226, "text": "and", "bbox": {"l": 50.333333333333336, "t": 451.0, "r": 64.0, "b": 458.0, "coord_origin": "1"}}, {"id": 227, "text": "in", "bbox": {"l": 67.0, "t": 451.0, "r": 74.0, "b": 458.0, "coord_origin": "1"}}, {"id": 228, "text": "the", "bbox": {"l": 77.0, "t": 451.0, "r": 88.33333333333333, "b": 458.0, "coord_origin": "1"}}, {"id": 229, "text": "presence", "bbox": {"l": 91.33333333333333, "t": 453.0, "r": 125.33333333333333, "b": 460.0, "coord_origin": "1"}}, {"id": 230, "text": "of", "bbox": {"l": 128.33333333333334, "t": 451.0, "r": 137.0, "b": 458.0, "coord_origin": "1"}}, {"id": 231, "text": "table", "bbox": {"l": 139.0, "t": 451.0, "r": 157.66666666666666, "b": 458.0, "coord_origin": "1"}}, {"id": 232, "text": "spans", "bbox": {"l": 160.66666666666666, "t": 453.0, "r": 182.0, "b": 460.3333333333333, "coord_origin": "1"}}, {"id": 233, "text": "a", "bbox": {"l": 184.66666666666666, "t": 453.0, "r": 189.0, "b": 458.0, "coord_origin": "1"}}, {"id": 234, "text": "cell", "bbox": {"l": 191.33333333333334, "t": 451.0, "r": 205.0, "b": 458.0, "coord_origin": "1"}}, {"id": 235, "text": "extends", "bbox": {"l": 208.0, "t": 451.0, "r": 237.66666666666666, "b": 458.0, "coord_origin": "1"}}, {"id": 236, "text": "across", "bbox": {"l": 240.66666666666666, "t": 453.0, "r": 265.0, "b": 458.0, "coord_origin": "1"}}, {"id": 237, "text": "mul-", "bbox": {"l": 268.0, "t": 451.0, "r": 286.0, "b": 458.0, "coord_origin": "1"}}, {"id": 238, "text": "tiple", "bbox": {"l": 50.333333333333336, "t": 462.6666666666667, "r": 67.33333333333333, "b": 471.6666666666667, "coord_origin": "1"}}, {"id": 239, "text": "grid", "bbox": {"l": 70.0, "t": 462.6666666666667, "r": 85.33333333333333, "b": 471.6666666666667, "coord_origin": "1"}}, {"id": 240, "text": "squares.", "bbox": {"l": 88.33333333333333, "t": 464.6666666666667, "r": 119.66666666666667, "b": 471.6666666666667, "coord_origin": "1"}}, {"id": 241, "text": "When", "bbox": {"l": 123.33333333333333, "t": 462.6666666666667, "r": 146.66666666666666, "b": 469.3333333333333, "coord_origin": "1"}}, {"id": 242, "text": "enough", "bbox": {"l": 149.33333333333334, "t": 462.6666666666667, "r": 178.0, "b": 471.6666666666667, "coord_origin": "1"}}, {"id": 243, "text": "bounding", "bbox": {"l": 180.66666666666666, "t": 462.6666666666667, "r": 217.66666666666666, "b": 471.6666666666667, "coord_origin": "1"}}, {"id": 244, "text": "boxes", "bbox": {"l": 220.33333333333334, "t": 462.6666666666667, "r": 243.0, "b": 469.3333333333333, "coord_origin": "1"}}, {"id": 245, "text": "are", "bbox": {"l": 245.66666666666666, "t": 464.6666666666667, "r": 257.0, "b": 469.3333333333333, "coord_origin": "1"}}, {"id": 246, "text": "known", "bbox": {"l": 259.6666666666667, "t": 462.6666666666667, "r": 286.0, "b": 469.3333333333333, "coord_origin": "1"}}, {"id": 247, "text": "for", "bbox": {"l": 50.666666666666664, "t": 474.6666666666667, "r": 61.666666666666664, "b": 481.3333333333333, "coord_origin": "1"}}, {"id": 248, "text": "a", "bbox": {"l": 65.66666666666667, "t": 476.6666666666667, "r": 69.66666666666667, "b": 481.3333333333333, "coord_origin": "1"}}, {"id": 249, "text": "rectangular", "bbox": {"l": 73.66666666666667, "t": 474.6666666666667, "r": 118.33333333333333, "b": 483.6666666666667, "coord_origin": "1"}}, {"id": 250, "text": "table,", "bbox": {"l": 122.0, "t": 474.6666666666667, "r": 143.33333333333334, "b": 482.3333333333333, "coord_origin": "1"}}, {"id": 251, "text": "it", "bbox": {"l": 148.0, "t": 474.6666666666667, "r": 152.66666666666666, "b": 481.3333333333333, "coord_origin": "1"}}, {"id": 252, "text": "is", "bbox": {"l": 157.33333333333334, "t": 474.6666666666667, "r": 163.33333333333334, "b": 481.3333333333333, "coord_origin": "1"}}, {"id": 253, "text": "possible", "bbox": {"l": 167.33333333333334, "t": 474.6666666666667, "r": 199.33333333333334, "b": 483.6666666666667, "coord_origin": "1"}}, {"id": 254, "text": "to", "bbox": {"l": 203.66666666666666, "t": 475.6666666666667, "r": 211.0, "b": 481.3333333333333, "coord_origin": "1"}}, {"id": 255, "text": "compute", "bbox": {"l": 215.0, "t": 475.6666666666667, "r": 248.66666666666666, "b": 483.6666666666667, "coord_origin": "1"}}, {"id": 256, "text": "the", "bbox": {"l": 253.33333333333334, "t": 474.6666666666667, "r": 264.6666666666667, "b": 481.3333333333333, "coord_origin": "1"}}, {"id": 257, "text": "geo-", "bbox": {"l": 268.6666666666667, "t": 476.6666666666667, "r": 286.0, "b": 483.6666666666667, "coord_origin": "1"}}, {"id": 258, "text": "metrical", "bbox": {"l": 50.333333333333336, "t": 486.6666666666667, "r": 82.33333333333333, "b": 493.6666666666667, "coord_origin": "1"}}, {"id": 259, "text": "border", "bbox": {"l": 86.33333333333333, "t": 486.6666666666667, "r": 112.33333333333333, "b": 493.3333333333333, "coord_origin": "1"}}, {"id": 260, "text": "lines", "bbox": {"l": 116.0, "t": 486.6666666666667, "r": 134.0, "b": 493.3333333333333, "coord_origin": "1"}}, {"id": 261, "text": "between", "bbox": {"l": 138.0, "t": 486.6666666666667, "r": 170.66666666666666, "b": 493.3333333333333, "coord_origin": "1"}}, {"id": 262, "text": "the", "bbox": {"l": 174.66666666666666, "t": 486.6666666666667, "r": 186.33333333333334, "b": 493.3333333333333, "coord_origin": "1"}}, {"id": 263, "text": "grid", "bbox": {"l": 190.33333333333334, "t": 486.6666666666667, "r": 206.0, "b": 495.6666666666667, "coord_origin": "1"}}, {"id": 264, "text": "rows", "bbox": {"l": 210.0, "t": 488.6666666666667, "r": 228.33333333333334, "b": 493.3333333333333, "coord_origin": "1"}}, {"id": 265, "text": "and", "bbox": {"l": 232.33333333333334, "t": 486.6666666666667, "r": 246.33333333333334, "b": 493.3333333333333, "coord_origin": "1"}}, {"id": 266, "text": "columns.", "bbox": {"l": 250.33333333333334, "t": 486.6666666666667, "r": 285.6666666666667, "b": 493.6666666666667, "coord_origin": "1"}}, {"id": 267, "text": "Eventually", "bbox": {"l": 50.333333333333336, "t": 498.6666666666667, "r": 92.66666666666667, "b": 507.6666666666667, "coord_origin": "1"}}, {"id": 268, "text": "this", "bbox": {"l": 96.33333333333333, "t": 498.6666666666667, "r": 110.0, "b": 505.3333333333333, "coord_origin": "1"}}, {"id": 269, "text": "information", "bbox": {"l": 113.33333333333333, "t": 498.6666666666667, "r": 159.66666666666666, "b": 505.3333333333333, "coord_origin": "1"}}, {"id": 270, "text": "is", "bbox": {"l": 163.33333333333334, "t": 498.6666666666667, "r": 169.0, "b": 505.3333333333333, "coord_origin": "1"}}, {"id": 271, "text": "used", "bbox": {"l": 172.66666666666666, "t": 498.6666666666667, "r": 190.0, "b": 505.6666666666667, "coord_origin": "1"}}, {"id": 272, "text": "to", "bbox": {"l": 193.66666666666666, "t": 499.6666666666667, "r": 200.66666666666666, "b": 505.3333333333333, "coord_origin": "1"}}, {"id": 273, "text": "generate", "bbox": {"l": 204.0, "t": 500.0, "r": 237.33333333333334, "b": 507.6666666666667, "coord_origin": "1"}}, {"id": 274, "text": "the", "bbox": {"l": 240.66666666666666, "t": 498.6666666666667, "r": 252.0, "b": 505.6666666666667, "coord_origin": "1"}}, {"id": 275, "text": "missing", "bbox": {"l": 255.66666666666666, "t": 498.6666666666667, "r": 286.0, "b": 507.6666666666667, "coord_origin": "1"}}, {"id": 276, "text": "bounding", "bbox": {"l": 50.333333333333336, "t": 510.6666666666667, "r": 87.33333333333333, "b": 519.6666666666666, "coord_origin": "1"}}, {"id": 277, "text": "boxes.", "bbox": {"l": 90.66666666666667, "t": 510.6666666666667, "r": 115.33333333333333, "b": 517.6666666666666, "coord_origin": "1"}}, {"id": 278, "text": "Additionally,", "bbox": {"l": 119.66666666666667, "t": 510.6666666666667, "r": 171.0, "b": 519.6666666666666, "coord_origin": "1"}}, {"id": 279, "text": "the", "bbox": {"l": 174.66666666666666, "t": 510.6666666666667, "r": 186.0, "b": 517.6666666666666, "coord_origin": "1"}}, {"id": 280, "text": "existence", "bbox": {"l": 189.0, "t": 510.6666666666667, "r": 225.66666666666666, "b": 517.6666666666666, "coord_origin": "1"}}, {"id": 281, "text": "of", "bbox": {"l": 228.66666666666666, "t": 510.6666666666667, "r": 237.33333333333334, "b": 517.3333333333334, "coord_origin": "1"}}, {"id": 282, "text": "unused", "bbox": {"l": 240.0, "t": 510.6666666666667, "r": 267.3333333333333, "b": 517.6666666666666, "coord_origin": "1"}}, {"id": 283, "text": "grid", "bbox": {"l": 270.3333333333333, "t": 510.6666666666667, "r": 286.0, "b": 519.6666666666666, "coord_origin": "1"}}, {"id": 284, "text": "squares", "bbox": {"l": 50.333333333333336, "t": 524.6666666666666, "r": 79.66666666666667, "b": 531.6666666666666, "coord_origin": "1"}}, {"id": 285, "text": "indicates", "bbox": {"l": 83.33333333333333, "t": 522.6666666666666, "r": 118.0, "b": 529.6666666666666, "coord_origin": "1"}}, {"id": 286, "text": "that", "bbox": {"l": 122.0, "t": 522.6666666666666, "r": 136.33333333333334, "b": 529.6666666666666, "coord_origin": "1"}}, {"id": 287, "text": "the", "bbox": {"l": 140.0, "t": 522.6666666666666, "r": 151.33333333333334, "b": 529.6666666666666, "coord_origin": "1"}}, {"id": 288, "text": "table", "bbox": {"l": 155.33333333333334, "t": 522.6666666666666, "r": 174.0, "b": 529.6666666666666, "coord_origin": "1"}}, {"id": 289, "text": "rows", "bbox": {"l": 177.66666666666666, "t": 524.6666666666666, "r": 196.0, "b": 529.3333333333334, "coord_origin": "1"}}, {"id": 290, "text": "have", "bbox": {"l": 200.0, "t": 522.6666666666666, "r": 217.66666666666666, "b": 529.6666666666666, "coord_origin": "1"}}, {"id": 291, "text": "unequal", "bbox": {"l": 221.66666666666666, "t": 522.6666666666666, "r": 252.33333333333334, "b": 531.6666666666666, "coord_origin": "1"}}, {"id": 292, "text": "number", "bbox": {"l": 256.3333333333333, "t": 522.6666666666666, "r": 286.3333333333333, "b": 529.6666666666666, "coord_origin": "1"}}, {"id": 293, "text": "of", "bbox": {"l": 50.333333333333336, "t": 534.6666666666666, "r": 59.0, "b": 541.3333333333334, "coord_origin": "1"}}, {"id": 294, "text": "columns", "bbox": {"l": 61.0, "t": 534.6666666666666, "r": 94.33333333333333, "b": 541.6666666666666, "coord_origin": "1"}}, {"id": 295, "text": "and", "bbox": {"l": 97.66666666666667, "t": 534.6666666666666, "r": 111.33333333333333, "b": 541.6666666666666, "coord_origin": "1"}}, {"id": 296, "text": "the", "bbox": {"l": 114.66666666666667, "t": 534.6666666666666, "r": 126.33333333333333, "b": 541.6666666666666, "coord_origin": "1"}}, {"id": 297, "text": "overall", "bbox": {"l": 129.66666666666666, "t": 534.6666666666666, "r": 156.33333333333334, "b": 541.6666666666666, "coord_origin": "1"}}, {"id": 298, "text": "structure", "bbox": {"l": 159.66666666666666, "t": 536.0, "r": 193.66666666666666, "b": 541.6666666666666, "coord_origin": "1"}}, {"id": 299, "text": "is", "bbox": {"l": 197.33333333333334, "t": 534.6666666666666, "r": 203.33333333333334, "b": 541.3333333333334, "coord_origin": "1"}}, {"id": 300, "text": "non-strict.", "bbox": {"l": 206.66666666666666, "t": 534.6666666666666, "r": 246.0, "b": 541.6666666666666, "coord_origin": "1"}}, {"id": 301, "text": "The", "bbox": {"l": 250.66666666666666, "t": 534.6666666666666, "r": 265.6666666666667, "b": 541.6666666666666, "coord_origin": "1"}}, {"id": 302, "text": "gen-", "bbox": {"l": 268.6666666666667, "t": 536.6666666666666, "r": 286.0, "b": 543.6666666666666, "coord_origin": "1"}}, {"id": 303, "text": "eration", "bbox": {"l": 50.333333333333336, "t": 546.6666666666666, "r": 77.33333333333333, "b": 553.6666666666666, "coord_origin": "1"}}, {"id": 304, "text": "of", "bbox": {"l": 80.33333333333333, "t": 546.6666666666666, "r": 89.0, "b": 553.3333333333334, "coord_origin": "1"}}, {"id": 305, "text": "missing", "bbox": {"l": 91.33333333333333, "t": 546.6666666666666, "r": 121.66666666666667, "b": 555.6666666666666, "coord_origin": "1"}}, {"id": 306, "text": "bounding", "bbox": {"l": 125.0, "t": 546.6666666666666, "r": 162.0, "b": 555.6666666666666, "coord_origin": "1"}}, {"id": 307, "text": "boxes", "bbox": {"l": 165.0, "t": 546.6666666666666, "r": 187.33333333333334, "b": 553.6666666666666, "coord_origin": "1"}}, {"id": 308, "text": "for", "bbox": {"l": 190.66666666666666, "t": 546.6666666666666, "r": 202.0, "b": 553.3333333333334, "coord_origin": "1"}}, {"id": 309, "text": "non-strict", "bbox": {"l": 204.66666666666666, "t": 546.6666666666666, "r": 242.33333333333334, "b": 553.6666666666666, "coord_origin": "1"}}, {"id": 310, "text": "HTML", "bbox": {"l": 245.33333333333334, "t": 546.6666666666666, "r": 273.0, "b": 553.3333333333334, "coord_origin": "1"}}, {"id": 311, "text": "ta-", "bbox": {"l": 276.0, "t": 547.6666666666666, "r": 286.0, "b": 553.6666666666666, "coord_origin": "1"}}, {"id": 312, "text": "bles", "bbox": {"l": 50.333333333333336, "t": 558.6666666666666, "r": 65.66666666666667, "b": 565.6666666666666, "coord_origin": "1"}}, {"id": 313, "text": "is", "bbox": {"l": 70.0, "t": 558.6666666666666, "r": 76.0, "b": 565.3333333333334, "coord_origin": "1"}}, {"id": 314, "text": "ambiguous", "bbox": {"l": 80.0, "t": 558.6666666666666, "r": 123.33333333333333, "b": 567.6666666666666, "coord_origin": "1"}}, {"id": 315, "text": "and", "bbox": {"l": 127.66666666666667, "t": 558.6666666666666, "r": 141.33333333333334, "b": 565.6666666666666, "coord_origin": "1"}}, {"id": 316, "text": "therefore", "bbox": {"l": 145.66666666666666, "t": 558.6666666666666, "r": 181.0, "b": 565.6666666666666, "coord_origin": "1"}}, {"id": 317, "text": "quite", "bbox": {"l": 185.0, "t": 558.6666666666666, "r": 204.33333333333334, "b": 567.6666666666666, "coord_origin": "1"}}, {"id": 318, "text": "challenging.", "bbox": {"l": 208.66666666666666, "t": 558.6666666666666, "r": 256.6666666666667, "b": 567.6666666666666, "coord_origin": "1"}}, {"id": 319, "text": "Thus,", "bbox": {"l": 264.0, "t": 558.6666666666666, "r": 285.6666666666667, "b": 566.6666666666666, "coord_origin": "1"}}, {"id": 320, "text": "we", "bbox": {"l": 50.333333333333336, "t": 572.6666666666666, "r": 61.333333333333336, "b": 577.6666666666666, "coord_origin": "1"}}, {"id": 321, "text": "have", "bbox": {"l": 65.0, "t": 570.6666666666666, "r": 82.66666666666667, "b": 577.6666666666666, "coord_origin": "1"}}, {"id": 322, "text": "decided", "bbox": {"l": 86.33333333333333, "t": 570.6666666666666, "r": 116.66666666666667, "b": 577.6666666666666, "coord_origin": "1"}}, {"id": 323, "text": "to", "bbox": {"l": 120.33333333333333, "t": 572.0, "r": 127.66666666666667, "b": 577.6666666666666, "coord_origin": "1"}}, {"id": 324, "text": "simply", "bbox": {"l": 131.0, "t": 570.6666666666666, "r": 157.33333333333334, "b": 579.6666666666666, "coord_origin": "1"}}, {"id": 325, "text": "discard", "bbox": {"l": 161.0, "t": 570.6666666666666, "r": 189.33333333333334, "b": 577.6666666666666, "coord_origin": "1"}}, {"id": 326, "text": "those", "bbox": {"l": 192.66666666666666, "t": 570.6666666666666, "r": 213.0, "b": 577.6666666666666, "coord_origin": "1"}}, {"id": 327, "text": "tables.", "bbox": {"l": 216.66666666666666, "t": 570.6666666666666, "r": 241.66666666666666, "b": 577.6666666666666, "coord_origin": "1"}}, {"id": 328, "text": "In", "bbox": {"l": 247.0, "t": 570.6666666666666, "r": 254.66666666666666, "b": 577.3333333333334, "coord_origin": "1"}}, {"id": 329, "text": "case", "bbox": {"l": 258.0, "t": 572.6666666666666, "r": 274.6666666666667, "b": 577.6666666666666, "coord_origin": "1"}}, {"id": 330, "text": "of", "bbox": {"l": 278.3333333333333, "t": 570.6666666666666, "r": 286.6666666666667, "b": 577.3333333333334, "coord_origin": "1"}}, {"id": 331, "text": "PubTabNet", "bbox": {"l": 50.333333333333336, "t": 582.6666666666666, "r": 94.33333333333333, "b": 589.6666666666666, "coord_origin": "1"}}, {"id": 332, "text": "we", "bbox": {"l": 97.66666666666667, "t": 584.6666666666666, "r": 108.66666666666667, "b": 589.6666666666666, "coord_origin": "1"}}, {"id": 333, "text": "have", "bbox": {"l": 112.0, "t": 582.6666666666666, "r": 129.66666666666666, "b": 589.6666666666666, "coord_origin": "1"}}, {"id": 334, "text": "computed", "bbox": {"l": 133.0, "t": 582.6666666666666, "r": 171.66666666666666, "b": 591.6666666666666, "coord_origin": "1"}}, {"id": 335, "text": "missing", "bbox": {"l": 175.33333333333334, "t": 582.6666666666666, "r": 205.66666666666666, "b": 591.6666666666666, "coord_origin": "1"}}, {"id": 336, "text": "bounding", "bbox": {"l": 209.0, "t": 582.6666666666666, "r": 245.66666666666666, "b": 591.6666666666666, "coord_origin": "1"}}, {"id": 337, "text": "boxes", "bbox": {"l": 249.33333333333334, "t": 582.6666666666666, "r": 271.6666666666667, "b": 589.6666666666666, "coord_origin": "1"}}, {"id": 338, "text": "for", "bbox": {"l": 275.3333333333333, "t": 582.6666666666666, "r": 286.3333333333333, "b": 589.3333333333334, "coord_origin": "1"}}, {"id": 339, "text": "48%", "bbox": {"l": 50.0, "t": 594.0, "r": 67.66666666666667, "b": 601.0, "coord_origin": "1"}}, {"id": 340, "text": "of", "bbox": {"l": 71.0, "t": 594.0, "r": 79.66666666666667, "b": 601.0, "coord_origin": "1"}}, {"id": 341, "text": "the", "bbox": {"l": 82.0, "t": 594.0, "r": 93.33333333333333, "b": 601.0, "coord_origin": "1"}}, {"id": 342, "text": "simple", "bbox": {"l": 96.66666666666667, "t": 594.0, "r": 122.66666666666667, "b": 603.3333333333334, "coord_origin": "1"}}, {"id": 343, "text": "and", "bbox": {"l": 125.66666666666667, "t": 594.0, "r": 139.33333333333334, "b": 601.0, "coord_origin": "1"}}, {"id": 344, "text": "69%", "bbox": {"l": 142.66666666666666, "t": 594.3333333333334, "r": 160.33333333333334, "b": 601.0, "coord_origin": "1"}}, {"id": 345, "text": "of", "bbox": {"l": 163.33333333333334, "t": 594.0, "r": 172.0, "b": 601.0, "coord_origin": "1"}}, {"id": 346, "text": "the", "bbox": {"l": 174.33333333333334, "t": 594.0, "r": 185.66666666666666, "b": 601.0, "coord_origin": "1"}}, {"id": 347, "text": "complex", "bbox": {"l": 189.0, "t": 594.0, "r": 222.33333333333334, "b": 603.3333333333334, "coord_origin": "1"}}, {"id": 348, "text": "tables.", "bbox": {"l": 225.66666666666666, "t": 594.0, "r": 250.33333333333334, "b": 601.0, "coord_origin": "1"}}, {"id": 349, "text": "Regard-", "bbox": {"l": 254.66666666666666, "t": 594.0, "r": 286.0, "b": 603.3333333333334, "coord_origin": "1"}}, {"id": 350, "text": "ing", "bbox": {"l": 50.333333333333336, "t": 606.0, "r": 62.666666666666664, "b": 615.3333333333334, "coord_origin": "1"}}, {"id": 351, "text": "FinTabNet,", "bbox": {"l": 65.66666666666667, "t": 606.0, "r": 109.66666666666667, "b": 614.0, "coord_origin": "1"}}, {"id": 352, "text": "68%", "bbox": {"l": 113.33333333333333, "t": 606.0, "r": 130.66666666666666, "b": 613.0, "coord_origin": "1"}}, {"id": 353, "text": "of", "bbox": {"l": 134.0, "t": 606.0, "r": 142.66666666666666, "b": 613.0, "coord_origin": "1"}}, {"id": 354, "text": "the", "bbox": {"l": 145.0, "t": 606.0, "r": 156.33333333333334, "b": 613.0, "coord_origin": "1"}}, {"id": 355, "text": "simple", "bbox": {"l": 159.66666666666666, "t": 606.0, "r": 185.66666666666666, "b": 615.3333333333334, "coord_origin": "1"}}, {"id": 356, "text": "and", "bbox": {"l": 189.0, "t": 606.0, "r": 202.66666666666666, "b": 613.0, "coord_origin": "1"}}, {"id": 357, "text": "98%", "bbox": {"l": 205.66666666666666, "t": 606.0, "r": 223.33333333333334, "b": 613.0, "coord_origin": "1"}}, {"id": 358, "text": "of", "bbox": {"l": 226.66666666666666, "t": 606.0, "r": 235.33333333333334, "b": 613.0, "coord_origin": "1"}}, {"id": 359, "text": "the", "bbox": {"l": 237.66666666666666, "t": 606.0, "r": 249.33333333333334, "b": 613.0, "coord_origin": "1"}}, {"id": 360, "text": "complex", "bbox": {"l": 252.33333333333334, "t": 606.0, "r": 285.6666666666667, "b": 615.3333333333334, "coord_origin": "1"}}, {"id": 361, "text": "tables", "bbox": {"l": 50.333333333333336, "t": 618.0, "r": 73.0, "b": 625.0, "coord_origin": "1"}}, {"id": 362, "text": "require", "bbox": {"l": 76.0, "t": 618.0, "r": 103.66666666666667, "b": 627.3333333333334, "coord_origin": "1"}}, {"id": 363, "text": "the", "bbox": {"l": 106.66666666666667, "t": 618.0, "r": 118.33333333333333, "b": 625.0, "coord_origin": "1"}}, {"id": 364, "text": "generation", "bbox": {"l": 121.33333333333333, "t": 618.0, "r": 163.0, "b": 627.3333333333334, "coord_origin": "1"}}, {"id": 365, "text": "of", "bbox": {"l": 166.0, "t": 618.0, "r": 174.33333333333334, "b": 625.0, "coord_origin": "1"}}, {"id": 366, "text": "bounding", "bbox": {"l": 176.66666666666666, "t": 618.0, "r": 214.0, "b": 627.3333333333334, "coord_origin": "1"}}, {"id": 367, "text": "boxes.", "bbox": {"l": 217.0, "t": 618.0, "r": 241.66666666666666, "b": 625.0, "coord_origin": "1"}}]}, {"id": 5, "label": "Text", "bbox": {"l": 49.99413299560547, "t": 629.9431762695312, "r": 286.0, "b": 651.344970703125, "coord_origin": "1"}, "confidence": 0.9655510187149048, "cells": [{"id": 368, "text": "Figure", "bbox": {"l": 62.333333333333336, "t": 630.6666666666666, "r": 87.66666666666667, "b": 639.6666666666666, "coord_origin": "1"}}, {"id": 369, "text": "7", "bbox": {"l": 91.66666666666667, "t": 630.6666666666666, "r": 96.0, "b": 637.3333333333334, "coord_origin": "1"}}, {"id": 370, "text": "illustrates", "bbox": {"l": 100.33333333333333, "t": 630.6666666666666, "r": 138.33333333333334, "b": 637.6666666666666, "coord_origin": "1"}}, {"id": 371, "text": "the", "bbox": {"l": 142.66666666666666, "t": 630.6666666666666, "r": 154.0, "b": 637.6666666666666, "coord_origin": "1"}}, {"id": 372, "text": "distribution", "bbox": {"l": 158.0, "t": 630.6666666666666, "r": 203.33333333333334, "b": 637.6666666666666, "coord_origin": "1"}}, {"id": 373, "text": "of", "bbox": {"l": 207.33333333333334, "t": 630.6666666666666, "r": 216.0, "b": 637.3333333333334, "coord_origin": "1"}}, {"id": 374, "text": "the", "bbox": {"l": 219.33333333333334, "t": 630.6666666666666, "r": 230.66666666666666, "b": 637.6666666666666, "coord_origin": "1"}}, {"id": 375, "text": "tables", "bbox": {"l": 235.0, "t": 630.6666666666666, "r": 257.6666666666667, "b": 637.6666666666666, "coord_origin": "1"}}, {"id": 376, "text": "across", "bbox": {"l": 261.6666666666667, "t": 632.6666666666666, "r": 286.0, "b": 637.6666666666666, "coord_origin": "1"}}, {"id": 377, "text": "different", "bbox": {"l": 50.333333333333336, "t": 642.0, "r": 83.66666666666667, "b": 649.0, "coord_origin": "1"}}, {"id": 378, "text": "dimensions", "bbox": {"l": 86.66666666666667, "t": 642.0, "r": 131.66666666666666, "b": 649.0, "coord_origin": "1"}}, {"id": 379, "text": "per", "bbox": {"l": 134.66666666666666, "t": 644.3333333333334, "r": 147.33333333333334, "b": 651.3333333333334, "coord_origin": "1"}}, {"id": 380, "text": "dataset.", "bbox": {"l": 149.66666666666666, "t": 642.0, "r": 179.0, "b": 649.0, "coord_origin": "1"}}]}, {"id": 6, "label": "Section-header", "bbox": {"l": 49.898033142089844, "t": 661.9161987304688, "r": 153.34835815429688, "b": 672.0421752929688, "coord_origin": "1"}, "confidence": 0.9235464930534363, "cells": [{"id": 381, "text": "1.2.", "bbox": {"l": 51.0, "t": 662.0, "r": 66.0, "b": 669.6666666666666, "coord_origin": "1"}}, {"id": 382, "text": "Synthetic", "bbox": {"l": 69.66666666666667, "t": 662.0, "r": 113.0, "b": 672.0, "coord_origin": "1"}}, {"id": 383, "text": "datasets", "bbox": {"l": 116.0, "t": 662.0, "r": 153.33333333333334, "b": 669.6666666666666, "coord_origin": "1"}}]}, {"id": 7, "label": "Text", "bbox": {"l": 49.784549713134766, "t": 680.5510864257812, "r": 286.6666666666667, "b": 714.0, "coord_origin": "1"}, "confidence": 0.9784752130508423, "cells": [{"id": 384, "text": "Aiming", "bbox": {"l": 62.333333333333336, "t": 681.0, "r": 92.0, "b": 690.0, "coord_origin": "1"}}, {"id": 385, "text": "to", "bbox": {"l": 96.66666666666667, "t": 682.3333333333334, "r": 104.0, "b": 688.0, "coord_origin": "1"}}, {"id": 386, "text": "train", "bbox": {"l": 108.66666666666667, "t": 681.0, "r": 126.33333333333333, "b": 688.0, "coord_origin": "1"}}, {"id": 387, "text": "and", "bbox": {"l": 130.66666666666666, "t": 681.0, "r": 144.66666666666666, "b": 688.0, "coord_origin": "1"}}, {"id": 388, "text": "evaluate", "bbox": {"l": 149.0, "t": 681.0, "r": 181.0, "b": 688.0, "coord_origin": "1"}}, {"id": 389, "text": "our", "bbox": {"l": 185.66666666666666, "t": 683.0, "r": 199.0, "b": 688.0, "coord_origin": "1"}}, {"id": 390, "text": "models", "bbox": {"l": 203.33333333333334, "t": 681.0, "r": 231.33333333333334, "b": 688.0, "coord_origin": "1"}}, {"id": 391, "text": "in", "bbox": {"l": 236.0, "t": 681.0, "r": 243.0, "b": 688.0, "coord_origin": "1"}}, {"id": 392, "text": "a", "bbox": {"l": 247.66666666666666, "t": 683.0, "r": 251.66666666666666, "b": 688.0, "coord_origin": "1"}}, {"id": 393, "text": "broader", "bbox": {"l": 256.0, "t": 681.0, "r": 286.3333333333333, "b": 688.0, "coord_origin": "1"}}, {"id": 394, "text": "spectrum", "bbox": {"l": 50.333333333333336, "t": 694.3333333333334, "r": 86.33333333333333, "b": 702.0, "coord_origin": "1"}}, {"id": 395, "text": "of", "bbox": {"l": 90.33333333333333, "t": 693.0, "r": 99.0, "b": 700.0, "coord_origin": "1"}}, {"id": 396, "text": "table", "bbox": {"l": 102.66666666666667, "t": 693.0, "r": 121.0, "b": 700.0, "coord_origin": "1"}}, {"id": 397, "text": "data", "bbox": {"l": 125.33333333333333, "t": 693.0, "r": 141.66666666666666, "b": 700.0, "coord_origin": "1"}}, {"id": 398, "text": "we", "bbox": {"l": 146.0, "t": 695.0, "r": 156.66666666666666, "b": 700.0, "coord_origin": "1"}}, {"id": 399, "text": "have", "bbox": {"l": 161.0, "t": 693.0, "r": 179.0, "b": 700.0, "coord_origin": "1"}}, {"id": 400, "text": "synthesized", "bbox": {"l": 183.33333333333334, "t": 693.0, "r": 229.0, "b": 702.0, "coord_origin": "1"}}, {"id": 401, "text": "four", "bbox": {"l": 233.33333333333334, "t": 693.0, "r": 249.66666666666666, "b": 700.0, "coord_origin": "1"}}, {"id": 402, "text": "types", "bbox": {"l": 253.66666666666666, "t": 694.3333333333334, "r": 274.0, "b": 702.0, "coord_origin": "1"}}, {"id": 403, "text": "of", "bbox": {"l": 278.3333333333333, "t": 693.0, "r": 286.6666666666667, "b": 700.0, "coord_origin": "1"}}, {"id": 404, "text": "datasets.", "bbox": {"l": 50.333333333333336, "t": 705.0, "r": 83.33333333333333, "b": 712.0, "coord_origin": "1"}}, {"id": 405, "text": "Each", "bbox": {"l": 91.66666666666667, "t": 705.0, "r": 110.66666666666667, "b": 712.0, "coord_origin": "1"}}, {"id": 406, "text": "one", "bbox": {"l": 115.0, "t": 707.0, "r": 129.0, "b": 712.0, "coord_origin": "1"}}, {"id": 407, "text": "contains", "bbox": {"l": 133.33333333333334, "t": 705.0, "r": 166.0, "b": 712.0, "coord_origin": "1"}}, {"id": 408, "text": "tables", "bbox": {"l": 170.33333333333334, "t": 705.0, "r": 193.0, "b": 712.0, "coord_origin": "1"}}, {"id": 409, "text": "with", "bbox": {"l": 197.66666666666666, "t": 705.0, "r": 214.66666666666666, "b": 712.0, "coord_origin": "1"}}, {"id": 410, "text": "different", "bbox": {"l": 219.0, "t": 705.0, "r": 252.66666666666666, "b": 712.0, "coord_origin": "1"}}, {"id": 411, "text": "appear-", "bbox": {"l": 257.0, "t": 707.0, "r": 286.0, "b": 714.0, "coord_origin": "1"}}]}, {"id": 8, "label": "Text", "bbox": {"l": 308.32464599609375, "t": 161.7657012939453, "r": 545.0006713867188, "b": 207.03915405273438, "coord_origin": "1"}, "confidence": 0.9791127443313599, "cells": [{"id": 412, "text": "ances", "bbox": {"l": 309.0, "t": 164.0, "r": 330.6666666666667, "b": 169.0, "coord_origin": "1"}}, {"id": 413, "text": "in", "bbox": {"l": 335.0, "t": 162.0, "r": 342.0, "b": 169.0, "coord_origin": "1"}}, {"id": 414, "text": "regard", "bbox": {"l": 346.6666666666667, "t": 162.0, "r": 371.0, "b": 171.0, "coord_origin": "1"}}, {"id": 415, "text": "to", "bbox": {"l": 375.6666666666667, "t": 163.33333333333337, "r": 383.0, "b": 169.0, "coord_origin": "1"}}, {"id": 416, "text": "their", "bbox": {"l": 387.3333333333333, "t": 162.0, "r": 405.0, "b": 169.0, "coord_origin": "1"}}, {"id": 417, "text": "size,", "bbox": {"l": 409.3333333333333, "t": 162.0, "r": 426.3333333333333, "b": 169.66666666666663, "coord_origin": "1"}}, {"id": 418, "text": "structure,", "bbox": {"l": 431.3333333333333, "t": 163.33333333333337, "r": 468.0, "b": 169.66666666666663, "coord_origin": "1"}}, {"id": 419, "text": "style", "bbox": {"l": 472.6666666666667, "t": 162.0, "r": 491.0, "b": 171.0, "coord_origin": "1"}}, {"id": 420, "text": "and", "bbox": {"l": 495.3333333333333, "t": 162.0, "r": 509.0, "b": 169.0, "coord_origin": "1"}}, {"id": 421, "text": "content.", "bbox": {"l": 513.3333333333334, "t": 163.33333333333337, "r": 544.3333333333334, "b": 169.0, "coord_origin": "1"}}, {"id": 422, "text": "Every", "bbox": {"l": 309.0, "t": 174.0, "r": 332.0, "b": 183.0, "coord_origin": "1"}}, {"id": 423, "text": "synthetic", "bbox": {"l": 336.0, "t": 174.0, "r": 371.0, "b": 183.0, "coord_origin": "1"}}, {"id": 424, "text": "dataset", "bbox": {"l": 374.6666666666667, "t": 174.0, "r": 402.0, "b": 181.0, "coord_origin": "1"}}, {"id": 425, "text": "contains", "bbox": {"l": 405.6666666666667, "t": 174.0, "r": 438.3333333333333, "b": 181.0, "coord_origin": "1"}}, {"id": 426, "text": "150k", "bbox": {"l": 443.3333333333333, "t": 174.0, "r": 461.3333333333333, "b": 181.0, "coord_origin": "1"}}, {"id": 427, "text": "examples,", "bbox": {"l": 465.0, "t": 174.0, "r": 504.0, "b": 183.0, "coord_origin": "1"}}, {"id": 428, "text": "summing", "bbox": {"l": 508.3333333333333, "t": 174.0, "r": 544.6666666666666, "b": 183.0, "coord_origin": "1"}}, {"id": 429, "text": "up", "bbox": {"l": 309.0, "t": 188.0, "r": 318.6666666666667, "b": 195.0, "coord_origin": "1"}}, {"id": 430, "text": "to", "bbox": {"l": 321.3333333333333, "t": 187.33333333333337, "r": 328.3333333333333, "b": 193.0, "coord_origin": "1"}}, {"id": 431, "text": "600k", "bbox": {"l": 331.3333333333333, "t": 186.0, "r": 350.6666666666667, "b": 193.0, "coord_origin": "1"}}, {"id": 432, "text": "synthetic", "bbox": {"l": 353.6666666666667, "t": 186.0, "r": 388.6666666666667, "b": 195.0, "coord_origin": "1"}}, {"id": 433, "text": "examples.", "bbox": {"l": 391.6666666666667, "t": 186.0, "r": 430.6666666666667, "b": 195.0, "coord_origin": "1"}}, {"id": 434, "text": "All", "bbox": {"l": 434.6666666666667, "t": 186.0, "r": 446.6666666666667, "b": 193.0, "coord_origin": "1"}}, {"id": 435, "text": "datasets", "bbox": {"l": 449.6666666666667, "t": 186.0, "r": 480.6666666666667, "b": 193.0, "coord_origin": "1"}}, {"id": 436, "text": "are", "bbox": {"l": 483.3333333333333, "t": 188.0, "r": 495.0, "b": 193.0, "coord_origin": "1"}}, {"id": 437, "text": "divided", "bbox": {"l": 497.6666666666667, "t": 186.0, "r": 527.0, "b": 193.0, "coord_origin": "1"}}, {"id": 438, "text": "into", "bbox": {"l": 530.0, "t": 186.0, "r": 545.0, "b": 193.0, "coord_origin": "1"}}, {"id": 439, "text": "Train,", "bbox": {"l": 309.0, "t": 198.0, "r": 332.0, "b": 205.66666666666663, "coord_origin": "1"}}, {"id": 440, "text": "Test", "bbox": {"l": 335.0, "t": 198.0, "r": 351.3333333333333, "b": 205.0, "coord_origin": "1"}}, {"id": 441, "text": "and", "bbox": {"l": 354.3333333333333, "t": 198.0, "r": 368.0, "b": 205.0, "coord_origin": "1"}}, {"id": 442, "text": "Val", "bbox": {"l": 371.0, "t": 198.0, "r": 383.6666666666667, "b": 205.0, "coord_origin": "1"}}, {"id": 443, "text": "splits", "bbox": {"l": 387.0, "t": 198.0, "r": 407.3333333333333, "b": 207.0, "coord_origin": "1"}}, {"id": 444, "text": "(80%,", "bbox": {"l": 410.3333333333333, "t": 198.0, "r": 433.6666666666667, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 445, "text": "10%,", "bbox": {"l": 438.0, "t": 198.0, "r": 457.0, "b": 205.66666666666663, "coord_origin": "1"}}, {"id": 446, "text": "10%).", "bbox": {"l": 461.3333333333333, "t": 198.0, "r": 483.3333333333333, "b": 206.33333333333337, "coord_origin": "1"}}]}, {"id": 9, "label": "Text", "bbox": {"l": 308.44775390625, "t": 210.41331481933594, "r": 544.8419799804688, "b": 232.35369873046875, "coord_origin": "1"}, "confidence": 0.9645320773124695, "cells": [{"id": 447, "text": "The", "bbox": {"l": 321.0, "t": 211.0, "r": 336.0, "b": 218.0, "coord_origin": "1"}}, {"id": 448, "text": "process", "bbox": {"l": 339.3333333333333, "t": 213.0, "r": 368.6666666666667, "b": 220.0, "coord_origin": "1"}}, {"id": 449, "text": "of", "bbox": {"l": 372.0, "t": 211.0, "r": 380.3333333333333, "b": 218.0, "coord_origin": "1"}}, {"id": 450, "text": "generating", "bbox": {"l": 382.6666666666667, "t": 211.0, "r": 424.3333333333333, "b": 220.0, "coord_origin": "1"}}, {"id": 451, "text": "a", "bbox": {"l": 427.6666666666667, "t": 213.0, "r": 431.6666666666667, "b": 218.0, "coord_origin": "1"}}, {"id": 452, "text": "synthetic", "bbox": {"l": 435.0, "t": 211.0, "r": 470.0, "b": 220.0, "coord_origin": "1"}}, {"id": 453, "text": "dataset", "bbox": {"l": 473.3333333333333, "t": 211.0, "r": 500.6666666666667, "b": 218.0, "coord_origin": "1"}}, {"id": 454, "text": "can", "bbox": {"l": 504.0, "t": 213.0, "r": 517.0, "b": 218.0, "coord_origin": "1"}}, {"id": 455, "text": "be", "bbox": {"l": 520.6666666666666, "t": 211.0, "r": 529.0, "b": 218.0, "coord_origin": "1"}}, {"id": 456, "text": "de-", "bbox": {"l": 532.6666666666666, "t": 211.0, "r": 544.6666666666666, "b": 218.0, "coord_origin": "1"}}, {"id": 457, "text": "composed", "bbox": {"l": 309.0, "t": 223.0, "r": 348.6666666666667, "b": 232.0, "coord_origin": "1"}}, {"id": 458, "text": "into", "bbox": {"l": 352.0, "t": 223.0, "r": 367.0, "b": 230.0, "coord_origin": "1"}}, {"id": 459, "text": "the", "bbox": {"l": 370.0, "t": 223.0, "r": 381.3333333333333, "b": 230.0, "coord_origin": "1"}}, {"id": 460, "text": "following", "bbox": {"l": 384.6666666666667, "t": 223.0, "r": 422.3333333333333, "b": 232.0, "coord_origin": "1"}}, {"id": 461, "text": "steps:", "bbox": {"l": 425.6666666666667, "t": 224.33333333333337, "r": 447.0, "b": 232.0, "coord_origin": "1"}}]}, {"id": 10, "label": "Text", "bbox": {"l": 308.4111022949219, "t": 235.2310333251953, "r": 545.0, "b": 316.1220397949219, "coord_origin": "1"}, "confidence": 0.9858567714691162, "cells": [{"id": 462, "text": "1.", "bbox": {"l": 322.3333333333333, "t": 235.66666666666663, "r": 327.3333333333333, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 463, "text": "Prepare", "bbox": {"l": 335.6666666666667, "t": 235.33333333333337, "r": 365.3333333333333, "b": 244.66666666666663, "coord_origin": "1"}}, {"id": 464, "text": "styling", "bbox": {"l": 370.0, "t": 235.33333333333337, "r": 396.3333333333333, "b": 244.66666666666663, "coord_origin": "1"}}, {"id": 465, "text": "and", "bbox": {"l": 400.6666666666667, "t": 235.33333333333337, "r": 414.6666666666667, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 466, "text": "content", "bbox": {"l": 419.0, "t": 236.66666666666663, "r": 447.6666666666667, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 467, "text": "templates:", "bbox": {"l": 452.3333333333333, "t": 235.33333333333337, "r": 492.0, "b": 244.66666666666663, "coord_origin": "1"}}, {"id": 468, "text": "The", "bbox": {"l": 498.6666666666667, "t": 235.33333333333337, "r": 513.6666666666666, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 469, "text": "styling", "bbox": {"l": 518.3333333333334, "t": 235.33333333333337, "r": 544.6666666666666, "b": 244.66666666666663, "coord_origin": "1"}}, {"id": 470, "text": "templates", "bbox": {"l": 309.0, "t": 247.33333333333337, "r": 346.6666666666667, "b": 256.66666666666674, "coord_origin": "1"}}, {"id": 471, "text": "have", "bbox": {"l": 350.0, "t": 247.33333333333337, "r": 368.0, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 472, "text": "been", "bbox": {"l": 371.3333333333333, "t": 247.33333333333337, "r": 389.3333333333333, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 473, "text": "manually", "bbox": {"l": 393.0, "t": 247.33333333333337, "r": 429.3333333333333, "b": 256.66666666666674, "coord_origin": "1"}}, {"id": 474, "text": "designed", "bbox": {"l": 432.3333333333333, "t": 247.33333333333337, "r": 467.3333333333333, "b": 256.66666666666674, "coord_origin": "1"}}, {"id": 475, "text": "and", "bbox": {"l": 471.0, "t": 247.33333333333337, "r": 484.6666666666667, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 476, "text": "organized", "bbox": {"l": 488.0, "t": 247.33333333333337, "r": 526.3333333333334, "b": 256.66666666666674, "coord_origin": "1"}}, {"id": 477, "text": "into", "bbox": {"l": 530.0, "t": 247.33333333333337, "r": 545.0, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 478, "text": "groups", "bbox": {"l": 309.0, "t": 261.66666666666674, "r": 335.6666666666667, "b": 268.66666666666674, "coord_origin": "1"}}, {"id": 479, "text": "of", "bbox": {"l": 339.6666666666667, "t": 259.33333333333326, "r": 348.3333333333333, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 480, "text": "scope", "bbox": {"l": 351.6666666666667, "t": 261.66666666666674, "r": 373.6666666666667, "b": 268.66666666666674, "coord_origin": "1"}}, {"id": 481, "text": "specific", "bbox": {"l": 378.0, "t": 259.33333333333326, "r": 407.6666666666667, "b": 268.66666666666674, "coord_origin": "1"}}, {"id": 482, "text": "appearances", "bbox": {"l": 412.0, "t": 261.66666666666674, "r": 460.0, "b": 268.66666666666674, "coord_origin": "1"}}, {"id": 483, "text": "(e.g.", "bbox": {"l": 464.3333333333333, "t": 260.0, "r": 481.0, "b": 268.66666666666674, "coord_origin": "1"}}, {"id": 484, "text": "financial", "bbox": {"l": 488.6666666666667, "t": 259.33333333333326, "r": 522.0, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 485, "text": "data,", "bbox": {"l": 526.0, "t": 259.33333333333326, "r": 544.3333333333334, "b": 267.0, "coord_origin": "1"}}, {"id": 486, "text": "marketing", "bbox": {"l": 309.0, "t": 271.33333333333326, "r": 349.0, "b": 280.6666666666667, "coord_origin": "1"}}, {"id": 487, "text": "data,", "bbox": {"l": 353.0, "t": 271.33333333333326, "r": 371.3333333333333, "b": 279.33333333333326, "coord_origin": "1"}}, {"id": 488, "text": "etc.)", "bbox": {"l": 376.0, "t": 271.66666666666674, "r": 393.0, "b": 279.66666666666674, "coord_origin": "1"}}, {"id": 489, "text": "Additionally,", "bbox": {"l": 400.3333333333333, "t": 271.33333333333326, "r": 451.6666666666667, "b": 280.6666666666667, "coord_origin": "1"}}, {"id": 490, "text": "we", "bbox": {"l": 456.6666666666667, "t": 273.66666666666674, "r": 467.6666666666667, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 491, "text": "have", "bbox": {"l": 472.0, "t": 271.33333333333326, "r": 489.6666666666667, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 492, "text": "prepared", "bbox": {"l": 494.0, "t": 271.33333333333326, "r": 528.3333333333334, "b": 280.6666666666667, "coord_origin": "1"}}, {"id": 493, "text": "cu-", "bbox": {"l": 532.3333333333334, "t": 273.66666666666674, "r": 544.6666666666666, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 494, "text": "rated", "bbox": {"l": 309.0, "t": 283.3333333333333, "r": 328.3333333333333, "b": 290.3333333333333, "coord_origin": "1"}}, {"id": 495, "text": "collections", "bbox": {"l": 331.0, "t": 283.3333333333333, "r": 373.6666666666667, "b": 290.3333333333333, "coord_origin": "1"}}, {"id": 496, "text": "of", "bbox": {"l": 376.3333333333333, "t": 283.3333333333333, "r": 384.6666666666667, "b": 290.3333333333333, "coord_origin": "1"}}, {"id": 497, "text": "content", "bbox": {"l": 386.3333333333333, "t": 284.6666666666667, "r": 415.3333333333333, "b": 290.3333333333333, "coord_origin": "1"}}, {"id": 498, "text": "templates", "bbox": {"l": 418.0, "t": 283.3333333333333, "r": 455.6666666666667, "b": 292.6666666666667, "coord_origin": "1"}}, {"id": 499, "text": "by", "bbox": {"l": 458.0, "t": 283.3333333333333, "r": 467.3333333333333, "b": 292.6666666666667, "coord_origin": "1"}}, {"id": 500, "text": "extracting", "bbox": {"l": 470.0, "t": 283.3333333333333, "r": 509.3333333333333, "b": 292.6666666666667, "coord_origin": "1"}}, {"id": 501, "text": "the", "bbox": {"l": 511.6666666666667, "t": 283.3333333333333, "r": 523.3333333333334, "b": 290.3333333333333, "coord_origin": "1"}}, {"id": 502, "text": "most", "bbox": {"l": 526.0, "t": 284.6666666666667, "r": 544.6666666666666, "b": 290.3333333333333, "coord_origin": "1"}}, {"id": 503, "text": "frequently", "bbox": {"l": 309.3333333333333, "t": 295.3333333333333, "r": 349.3333333333333, "b": 304.6666666666667, "coord_origin": "1"}}, {"id": 504, "text": "used", "bbox": {"l": 354.6666666666667, "t": 295.3333333333333, "r": 372.0, "b": 302.3333333333333, "coord_origin": "1"}}, {"id": 505, "text": "terms", "bbox": {"l": 377.0, "t": 296.6666666666667, "r": 398.3333333333333, "b": 302.3333333333333, "coord_origin": "1"}}, {"id": 506, "text": "out", "bbox": {"l": 403.3333333333333, "t": 296.6666666666667, "r": 415.6666666666667, "b": 302.3333333333333, "coord_origin": "1"}}, {"id": 507, "text": "of", "bbox": {"l": 420.3333333333333, "t": 295.3333333333333, "r": 429.0, "b": 302.3333333333333, "coord_origin": "1"}}, {"id": 508, "text": "non-synthetic", "bbox": {"l": 433.0, "t": 295.3333333333333, "r": 486.6666666666667, "b": 304.6666666666667, "coord_origin": "1"}}, {"id": 509, "text": "datasets", "bbox": {"l": 491.6666666666667, "t": 295.3333333333333, "r": 522.6666666666666, "b": 302.3333333333333, "coord_origin": "1"}}, {"id": 510, "text": "(e.g.", "bbox": {"l": 527.6666666666666, "t": 295.6666666666667, "r": 544.3333333333334, "b": 304.6666666666667, "coord_origin": "1"}}, {"id": 511, "text": "PubTabNet,", "bbox": {"l": 309.0, "t": 307.0, "r": 355.3333333333333, "b": 314.6666666666667, "coord_origin": "1"}}, {"id": 512, "text": "FinTabNet,", "bbox": {"l": 358.6666666666667, "t": 307.0, "r": 402.6666666666667, "b": 314.6666666666667, "coord_origin": "1"}}, {"id": 513, "text": "etc.).", "bbox": {"l": 406.0, "t": 307.6666666666667, "r": 425.0, "b": 315.3333333333333, "coord_origin": "1"}}]}, {"id": 11, "label": "Text", "bbox": {"l": 308.2052001953125, "t": 319.20440673828125, "r": 545.3333333333334, "b": 448.723388671875, "coord_origin": "1"}, "confidence": 0.9882545471191406, "cells": [{"id": 514, "text": "2.", "bbox": {"l": 321.0, "t": 320.0, "r": 327.3333333333333, "b": 327.0, "coord_origin": "1"}}, {"id": 515, "text": "Generate", "bbox": {"l": 333.0, "t": 320.0, "r": 368.3333333333333, "b": 327.0, "coord_origin": "1"}}, {"id": 516, "text": "table", "bbox": {"l": 372.0, "t": 320.0, "r": 390.6666666666667, "b": 327.0, "coord_origin": "1"}}, {"id": 517, "text": "structures:", "bbox": {"l": 394.3333333333333, "t": 321.0, "r": 434.3333333333333, "b": 327.0, "coord_origin": "1"}}, {"id": 518, "text": "The", "bbox": {"l": 439.3333333333333, "t": 320.0, "r": 454.3333333333333, "b": 327.0, "coord_origin": "1"}}, {"id": 519, "text": "structure", "bbox": {"l": 458.0, "t": 321.3333333333333, "r": 492.3333333333333, "b": 327.0, "coord_origin": "1"}}, {"id": 520, "text": "of", "bbox": {"l": 495.6666666666667, "t": 320.0, "r": 504.3333333333333, "b": 327.0, "coord_origin": "1"}}, {"id": 521, "text": "each", "bbox": {"l": 507.0, "t": 320.0, "r": 524.6666666666666, "b": 327.0, "coord_origin": "1"}}, {"id": 522, "text": "syn-", "bbox": {"l": 528.3333333333334, "t": 322.0, "r": 544.6666666666666, "b": 329.0, "coord_origin": "1"}}, {"id": 523, "text": "thetic", "bbox": {"l": 309.0, "t": 332.0, "r": 330.6666666666667, "b": 339.0, "coord_origin": "1"}}, {"id": 524, "text": "dataset", "bbox": {"l": 334.3333333333333, "t": 332.0, "r": 361.3333333333333, "b": 339.0, "coord_origin": "1"}}, {"id": 525, "text": "assumes", "bbox": {"l": 365.0, "t": 334.0, "r": 397.6666666666667, "b": 339.0, "coord_origin": "1"}}, {"id": 526, "text": "a", "bbox": {"l": 401.3333333333333, "t": 334.0, "r": 405.3333333333333, "b": 339.0, "coord_origin": "1"}}, {"id": 527, "text": "horizontal", "bbox": {"l": 409.0, "t": 332.0, "r": 448.6666666666667, "b": 339.0, "coord_origin": "1"}}, {"id": 528, "text": "table", "bbox": {"l": 452.6666666666667, "t": 332.0, "r": 471.3333333333333, "b": 339.0, "coord_origin": "1"}}, {"id": 529, "text": "header", "bbox": {"l": 475.0, "t": 332.0, "r": 501.3333333333333, "b": 339.0, "coord_origin": "1"}}, {"id": 530, "text": "which", "bbox": {"l": 504.6666666666667, "t": 332.0, "r": 528.3333333333334, "b": 339.0, "coord_origin": "1"}}, {"id": 531, "text": "po-", "bbox": {"l": 532.0, "t": 334.0, "r": 544.6666666666666, "b": 341.0, "coord_origin": "1"}}, {"id": 532, "text": "tentially", "bbox": {"l": 309.0, "t": 344.0, "r": 341.0, "b": 353.0, "coord_origin": "1"}}, {"id": 533, "text": "spans", "bbox": {"l": 346.0, "t": 346.0, "r": 367.6666666666667, "b": 353.0, "coord_origin": "1"}}, {"id": 534, "text": "over", "bbox": {"l": 372.3333333333333, "t": 346.0, "r": 389.6666666666667, "b": 351.0, "coord_origin": "1"}}, {"id": 535, "text": "multiple", "bbox": {"l": 394.3333333333333, "t": 344.0, "r": 426.6666666666667, "b": 353.0, "coord_origin": "1"}}, {"id": 536, "text": "rows", "bbox": {"l": 431.6666666666667, "t": 346.0, "r": 450.3333333333333, "b": 351.0, "coord_origin": "1"}}, {"id": 537, "text": "and", "bbox": {"l": 455.0, "t": 344.0, "r": 468.6666666666667, "b": 351.0, "coord_origin": "1"}}, {"id": 538, "text": "a", "bbox": {"l": 473.6666666666667, "t": 346.0, "r": 477.6666666666667, "b": 351.0, "coord_origin": "1"}}, {"id": 539, "text": "table", "bbox": {"l": 482.6666666666667, "t": 344.0, "r": 501.3333333333333, "b": 351.0, "coord_origin": "1"}}, {"id": 540, "text": "body", "bbox": {"l": 506.3333333333333, "t": 344.0, "r": 525.3333333333334, "b": 353.0, "coord_origin": "1"}}, {"id": 541, "text": "that", "bbox": {"l": 530.6666666666666, "t": 344.0, "r": 544.6666666666666, "b": 351.0, "coord_origin": "1"}}, {"id": 542, "text": "may", "bbox": {"l": 309.0, "t": 358.0, "r": 325.6666666666667, "b": 365.0, "coord_origin": "1"}}, {"id": 543, "text": "contain", "bbox": {"l": 328.3333333333333, "t": 356.0, "r": 357.3333333333333, "b": 363.0, "coord_origin": "1"}}, {"id": 544, "text": "a", "bbox": {"l": 360.3333333333333, "t": 358.0, "r": 364.3333333333333, "b": 363.0, "coord_origin": "1"}}, {"id": 545, "text": "combination", "bbox": {"l": 367.0, "t": 356.0, "r": 416.0, "b": 363.0, "coord_origin": "1"}}, {"id": 546, "text": "of", "bbox": {"l": 419.0, "t": 356.0, "r": 427.6666666666667, "b": 363.0, "coord_origin": "1"}}, {"id": 547, "text": "row", "bbox": {"l": 429.6666666666667, "t": 358.0, "r": 444.3333333333333, "b": 363.0, "coord_origin": "1"}}, {"id": 548, "text": "spans", "bbox": {"l": 447.3333333333333, "t": 358.0, "r": 468.6666666666667, "b": 365.0, "coord_origin": "1"}}, {"id": 549, "text": "and", "bbox": {"l": 471.6666666666667, "t": 356.0, "r": 485.3333333333333, "b": 363.0, "coord_origin": "1"}}, {"id": 550, "text": "column", "bbox": {"l": 488.3333333333333, "t": 356.0, "r": 517.6666666666666, "b": 363.0, "coord_origin": "1"}}, {"id": 551, "text": "spans.", "bbox": {"l": 520.6666666666666, "t": 358.0, "r": 544.3333333333334, "b": 365.0, "coord_origin": "1"}}, {"id": 552, "text": "However,", "bbox": {"l": 309.3333333333333, "t": 368.0, "r": 346.3333333333333, "b": 375.6666666666667, "coord_origin": "1"}}, {"id": 553, "text": "spans", "bbox": {"l": 350.3333333333333, "t": 370.0, "r": 371.6666666666667, "b": 377.0, "coord_origin": "1"}}, {"id": 554, "text": "are", "bbox": {"l": 375.3333333333333, "t": 370.0, "r": 386.6666666666667, "b": 375.0, "coord_origin": "1"}}, {"id": 555, "text": "not", "bbox": {"l": 390.3333333333333, "t": 369.0, "r": 402.6666666666667, "b": 375.0, "coord_origin": "1"}}, {"id": 556, "text": "allowed", "bbox": {"l": 406.0, "t": 368.0, "r": 436.6666666666667, "b": 375.0, "coord_origin": "1"}}, {"id": 557, "text": "to", "bbox": {"l": 440.3333333333333, "t": 369.3333333333333, "r": 447.6666666666667, "b": 375.0, "coord_origin": "1"}}, {"id": 558, "text": "cross", "bbox": {"l": 451.0, "t": 370.0, "r": 471.0, "b": 375.0, "coord_origin": "1"}}, {"id": 559, "text": "the", "bbox": {"l": 474.6666666666667, "t": 368.0, "r": 486.0, "b": 375.0, "coord_origin": "1"}}, {"id": 560, "text": "header", "bbox": {"l": 489.6666666666667, "t": 368.0, "r": 516.0, "b": 375.0, "coord_origin": "1"}}, {"id": 561, "text": "-", "bbox": {"l": 519.3333333333334, "t": 372.0, "r": 521.6666666666666, "b": 373.0, "coord_origin": "1"}}, {"id": 562, "text": "body", "bbox": {"l": 525.3333333333334, "t": 368.0, "r": 544.6666666666666, "b": 377.0, "coord_origin": "1"}}, {"id": 563, "text": "boundary.", "bbox": {"l": 309.0, "t": 380.0, "r": 347.6666666666667, "b": 389.0, "coord_origin": "1"}}, {"id": 564, "text": "The", "bbox": {"l": 353.6666666666667, "t": 380.0, "r": 368.6666666666667, "b": 387.0, "coord_origin": "1"}}, {"id": 565, "text": "table", "bbox": {"l": 372.3333333333333, "t": 380.0, "r": 391.3333333333333, "b": 387.0, "coord_origin": "1"}}, {"id": 566, "text": "structure", "bbox": {"l": 395.0, "t": 381.3333333333333, "r": 429.3333333333333, "b": 387.0, "coord_origin": "1"}}, {"id": 567, "text": "is", "bbox": {"l": 433.0, "t": 380.0, "r": 439.0, "b": 387.0, "coord_origin": "1"}}, {"id": 568, "text": "described", "bbox": {"l": 442.6666666666667, "t": 380.0, "r": 480.3333333333333, "b": 387.0, "coord_origin": "1"}}, {"id": 569, "text": "by", "bbox": {"l": 484.3333333333333, "t": 380.0, "r": 493.3333333333333, "b": 389.0, "coord_origin": "1"}}, {"id": 570, "text": "the", "bbox": {"l": 497.3333333333333, "t": 380.0, "r": 509.0, "b": 387.0, "coord_origin": "1"}}, {"id": 571, "text": "parame-", "bbox": {"l": 512.6666666666666, "t": 382.0, "r": 544.6666666666666, "b": 389.0, "coord_origin": "1"}}, {"id": 572, "text": "ters:", "bbox": {"l": 309.0, "t": 392.6666666666667, "r": 325.0, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 573, "text": "Total", "bbox": {"l": 331.0, "t": 391.6666666666667, "r": 350.6666666666667, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 574, "text": "number", "bbox": {"l": 354.6666666666667, "t": 391.6666666666667, "r": 385.0, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 575, "text": "of", "bbox": {"l": 388.6666666666667, "t": 391.3333333333333, "r": 397.0, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 576, "text": "table", "bbox": {"l": 400.3333333333333, "t": 391.6666666666667, "r": 419.0, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 577, "text": "rows", "bbox": {"l": 423.0, "t": 393.6666666666667, "r": 441.6666666666667, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 578, "text": "and", "bbox": {"l": 445.6666666666667, "t": 391.3333333333333, "r": 459.3333333333333, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 579, "text": "columns,", "bbox": {"l": 463.3333333333333, "t": 391.3333333333333, "r": 498.6666666666667, "b": 399.0, "coord_origin": "1"}}, {"id": 580, "text": "number", "bbox": {"l": 503.3333333333333, "t": 391.3333333333333, "r": 533.3333333333334, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 581, "text": "of", "bbox": {"l": 537.0, "t": 391.3333333333333, "r": 545.3333333333334, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 582, "text": "header", "bbox": {"l": 309.0, "t": 403.3333333333333, "r": 335.3333333333333, "b": 410.3333333333333, "coord_origin": "1"}}, {"id": 583, "text": "rows,", "bbox": {"l": 339.3333333333333, "t": 405.6666666666667, "r": 360.3333333333333, "b": 411.3333333333333, "coord_origin": "1"}}, {"id": 584, "text": "type", "bbox": {"l": 365.3333333333333, "t": 404.6666666666667, "r": 381.6666666666667, "b": 412.6666666666667, "coord_origin": "1"}}, {"id": 585, "text": "of", "bbox": {"l": 386.3333333333333, "t": 403.3333333333333, "r": 394.6666666666667, "b": 410.3333333333333, "coord_origin": "1"}}, {"id": 586, "text": "spans", "bbox": {"l": 398.6666666666667, "t": 405.6666666666667, "r": 420.0, "b": 412.6666666666667, "coord_origin": "1"}}, {"id": 587, "text": "(header", "bbox": {"l": 424.6666666666667, "t": 403.3333333333333, "r": 454.0, "b": 411.6666666666667, "coord_origin": "1"}}, {"id": 588, "text": "only", "bbox": {"l": 458.0, "t": 403.6666666666667, "r": 475.3333333333333, "b": 412.6666666666667, "coord_origin": "1"}}, {"id": 589, "text": "spans,", "bbox": {"l": 480.0, "t": 405.6666666666667, "r": 503.6666666666667, "b": 412.6666666666667, "coord_origin": "1"}}, {"id": 590, "text": "row", "bbox": {"l": 508.3333333333333, "t": 405.6666666666667, "r": 523.0, "b": 410.3333333333333, "coord_origin": "1"}}, {"id": 591, "text": "only", "bbox": {"l": 527.6666666666666, "t": 403.6666666666667, "r": 544.6666666666666, "b": 412.6666666666667, "coord_origin": "1"}}, {"id": 592, "text": "spans,", "bbox": {"l": 309.0, "t": 417.6666666666667, "r": 333.0, "b": 424.6666666666667, "coord_origin": "1"}}, {"id": 593, "text": "column", "bbox": {"l": 338.3333333333333, "t": 415.6666666666667, "r": 367.3333333333333, "b": 422.3333333333333, "coord_origin": "1"}}, {"id": 594, "text": "only", "bbox": {"l": 372.3333333333333, "t": 415.6666666666667, "r": 389.3333333333333, "b": 424.6666666666667, "coord_origin": "1"}}, {"id": 595, "text": "spans,", "bbox": {"l": 394.3333333333333, "t": 417.6666666666667, "r": 418.0, "b": 424.6666666666667, "coord_origin": "1"}}, {"id": 596, "text": "both", "bbox": {"l": 423.6666666666667, "t": 415.6666666666667, "r": 440.6666666666667, "b": 422.3333333333333, "coord_origin": "1"}}, {"id": 597, "text": "row", "bbox": {"l": 445.3333333333333, "t": 417.6666666666667, "r": 460.0, "b": 422.3333333333333, "coord_origin": "1"}}, {"id": 598, "text": "and", "bbox": {"l": 464.6666666666667, "t": 415.6666666666667, "r": 478.3333333333333, "b": 422.3333333333333, "coord_origin": "1"}}, {"id": 599, "text": "column", "bbox": {"l": 483.3333333333333, "t": 415.6666666666667, "r": 512.6666666666666, "b": 422.3333333333333, "coord_origin": "1"}}, {"id": 600, "text": "spans),", "bbox": {"l": 517.3333333333334, "t": 415.6666666666667, "r": 544.3333333333334, "b": 424.6666666666667, "coord_origin": "1"}}, {"id": 601, "text": "maximum", "bbox": {"l": 309.0, "t": 427.3333333333333, "r": 348.6666666666667, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 602, "text": "span", "bbox": {"l": 352.6666666666667, "t": 429.6666666666667, "r": 370.0, "b": 436.6666666666667, "coord_origin": "1"}}, {"id": 603, "text": "size", "bbox": {"l": 374.0, "t": 427.3333333333333, "r": 388.6666666666667, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 604, "text": "and", "bbox": {"l": 392.0, "t": 427.6666666666667, "r": 406.0, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 605, "text": "the", "bbox": {"l": 409.6666666666667, "t": 427.6666666666667, "r": 421.0, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 606, "text": "ratio", "bbox": {"l": 424.6666666666667, "t": 427.3333333333333, "r": 442.3333333333333, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 607, "text": "of", "bbox": {"l": 445.6666666666667, "t": 427.3333333333333, "r": 454.3333333333333, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 608, "text": "the", "bbox": {"l": 457.3333333333333, "t": 427.6666666666667, "r": 468.6666666666667, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 609, "text": "table", "bbox": {"l": 472.3333333333333, "t": 427.6666666666667, "r": 491.0, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 610, "text": "area", "bbox": {"l": 494.6666666666667, "t": 429.6666666666667, "r": 510.6666666666667, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 611, "text": "covered", "bbox": {"l": 514.0, "t": 427.6666666666667, "r": 544.6666666666666, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 612, "text": "by", "bbox": {"l": 309.0, "t": 439.6666666666667, "r": 318.3333333333333, "b": 448.6666666666667, "coord_origin": "1"}}, {"id": 613, "text": "spans.", "bbox": {"l": 321.6666666666667, "t": 441.6666666666667, "r": 345.3333333333333, "b": 448.6666666666667, "coord_origin": "1"}}]}, {"id": 12, "label": "Text", "bbox": {"l": 308.17218017578125, "t": 451.7388000488281, "r": 545.3333333333334, "b": 497.0, "coord_origin": "1"}, "confidence": 0.9816291332244873, "cells": [{"id": 614, "text": "3.", "bbox": {"l": 321.0, "t": 452.3333333333333, "r": 327.3333333333333, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 615, "text": "Generate", "bbox": {"l": 331.3333333333333, "t": 452.3333333333333, "r": 366.6666666666667, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 616, "text": "content:", "bbox": {"l": 369.6666666666667, "t": 453.6666666666667, "r": 401.0, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 617, "text": "Based", "bbox": {"l": 405.0, "t": 452.3333333333333, "r": 428.6666666666667, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 618, "text": "on", "bbox": {"l": 431.3333333333333, "t": 454.6666666666667, "r": 441.0, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 619, "text": "the", "bbox": {"l": 444.0, "t": 452.3333333333333, "r": 455.3333333333333, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 620, "text": "dataset", "bbox": {"l": 458.3333333333333, "t": 452.3333333333333, "r": 485.3333333333333, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 621, "text": "theme,", "bbox": {"l": 488.3333333333333, "t": 452.3333333333333, "r": 513.6666666666666, "b": 460.3333333333333, "coord_origin": "1"}}, {"id": 622, "text": "a", "bbox": {"l": 517.0, "t": 454.6666666666667, "r": 521.0, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 623, "text": "set", "bbox": {"l": 523.6666666666666, "t": 453.6666666666667, "r": 534.0, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 624, "text": "of", "bbox": {"l": 537.0, "t": 452.3333333333333, "r": 545.3333333333334, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 625, "text": "suitable", "bbox": {"l": 309.0, "t": 464.0, "r": 339.3333333333333, "b": 471.0, "coord_origin": "1"}}, {"id": 626, "text": "content", "bbox": {"l": 342.3333333333333, "t": 465.3333333333333, "r": 371.0, "b": 471.0, "coord_origin": "1"}}, {"id": 627, "text": "templates", "bbox": {"l": 374.0, "t": 464.0, "r": 411.3333333333333, "b": 473.0, "coord_origin": "1"}}, {"id": 628, "text": "is", "bbox": {"l": 414.3333333333333, "t": 464.0, "r": 420.3333333333333, "b": 471.0, "coord_origin": "1"}}, {"id": 629, "text": "chosen", "bbox": {"l": 423.0, "t": 464.0, "r": 450.3333333333333, "b": 471.0, "coord_origin": "1"}}, {"id": 630, "text": "first.", "bbox": {"l": 453.3333333333333, "t": 464.0, "r": 470.0, "b": 471.0, "coord_origin": "1"}}, {"id": 631, "text": "Then,", "bbox": {"l": 474.0, "t": 464.0, "r": 496.3333333333333, "b": 471.6666666666667, "coord_origin": "1"}}, {"id": 632, "text": "this", "bbox": {"l": 499.3333333333333, "t": 464.0, "r": 513.3333333333334, "b": 471.0, "coord_origin": "1"}}, {"id": 633, "text": "content", "bbox": {"l": 516.0, "t": 465.3333333333333, "r": 544.6666666666666, "b": 471.0, "coord_origin": "1"}}, {"id": 634, "text": "can", "bbox": {"l": 309.0, "t": 478.0, "r": 322.3333333333333, "b": 483.0, "coord_origin": "1"}}, {"id": 635, "text": "be", "bbox": {"l": 326.6666666666667, "t": 476.0, "r": 335.3333333333333, "b": 483.0, "coord_origin": "1"}}, {"id": 636, "text": "combined", "bbox": {"l": 339.6666666666667, "t": 476.0, "r": 378.3333333333333, "b": 483.0, "coord_origin": "1"}}, {"id": 637, "text": "with", "bbox": {"l": 383.0, "t": 476.0, "r": 400.0, "b": 483.0, "coord_origin": "1"}}, {"id": 638, "text": "purely", "bbox": {"l": 404.0, "t": 476.0, "r": 428.6666666666667, "b": 485.0, "coord_origin": "1"}}, {"id": 639, "text": "random", "bbox": {"l": 433.3333333333333, "t": 476.0, "r": 463.0, "b": 483.0, "coord_origin": "1"}}, {"id": 640, "text": "text", "bbox": {"l": 467.3333333333333, "t": 477.3333333333333, "r": 481.6666666666667, "b": 483.0, "coord_origin": "1"}}, {"id": 641, "text": "to", "bbox": {"l": 486.0, "t": 477.3333333333333, "r": 493.0, "b": 483.0, "coord_origin": "1"}}, {"id": 642, "text": "produce", "bbox": {"l": 497.3333333333333, "t": 476.0, "r": 528.6666666666666, "b": 485.0, "coord_origin": "1"}}, {"id": 643, "text": "the", "bbox": {"l": 533.3333333333334, "t": 476.0, "r": 544.6666666666666, "b": 483.0, "coord_origin": "1"}}, {"id": 644, "text": "synthetic", "bbox": {"l": 309.0, "t": 488.0, "r": 344.3333333333333, "b": 497.0, "coord_origin": "1"}}, {"id": 645, "text": "content.", "bbox": {"l": 347.3333333333333, "t": 489.0, "r": 378.3333333333333, "b": 495.0, "coord_origin": "1"}}]}, {"id": 13, "label": "Text", "bbox": {"l": 308.402587890625, "t": 500.48095703125, "r": 545.0632934570312, "b": 545.6666666666666, "coord_origin": "1"}, "confidence": 0.9804794788360596, "cells": [{"id": 646, "text": "4.", "bbox": {"l": 320.6666666666667, "t": 501.0, "r": 327.3333333333333, "b": 508.0, "coord_origin": "1"}}, {"id": 647, "text": "Apply", "bbox": {"l": 334.3333333333333, "t": 501.0, "r": 358.6666666666667, "b": 510.0, "coord_origin": "1"}}, {"id": 648, "text": "styling", "bbox": {"l": 363.0, "t": 501.0, "r": 389.3333333333333, "b": 510.0, "coord_origin": "1"}}, {"id": 649, "text": "templates:", "bbox": {"l": 393.3333333333333, "t": 501.0, "r": 433.3333333333333, "b": 510.0, "coord_origin": "1"}}, {"id": 650, "text": "Depending", "bbox": {"l": 439.3333333333333, "t": 501.0, "r": 482.3333333333333, "b": 510.0, "coord_origin": "1"}}, {"id": 651, "text": "on", "bbox": {"l": 486.3333333333333, "t": 503.0, "r": 495.6666666666667, "b": 508.0, "coord_origin": "1"}}, {"id": 652, "text": "the", "bbox": {"l": 500.0, "t": 501.0, "r": 511.3333333333333, "b": 508.0, "coord_origin": "1"}}, {"id": 653, "text": "domain", "bbox": {"l": 515.3333333333334, "t": 501.0, "r": 544.6666666666666, "b": 508.0, "coord_origin": "1"}}, {"id": 654, "text": "of", "bbox": {"l": 309.0, "t": 513.0, "r": 317.6666666666667, "b": 520.0, "coord_origin": "1"}}, {"id": 655, "text": "the", "bbox": {"l": 321.3333333333333, "t": 513.0, "r": 332.6666666666667, "b": 520.0, "coord_origin": "1"}}, {"id": 656, "text": "synthetic", "bbox": {"l": 337.3333333333333, "t": 513.0, "r": 372.3333333333333, "b": 522.0, "coord_origin": "1"}}, {"id": 657, "text": "dataset,", "bbox": {"l": 376.6666666666667, "t": 513.0, "r": 406.3333333333333, "b": 520.6666666666666, "coord_origin": "1"}}, {"id": 658, "text": "a", "bbox": {"l": 411.3333333333333, "t": 515.0, "r": 415.3333333333333, "b": 520.0, "coord_origin": "1"}}, {"id": 659, "text": "set", "bbox": {"l": 419.6666666666667, "t": 514.0, "r": 430.0, "b": 520.0, "coord_origin": "1"}}, {"id": 660, "text": "of", "bbox": {"l": 434.3333333333333, "t": 513.0, "r": 443.0, "b": 520.0, "coord_origin": "1"}}, {"id": 661, "text": "styling", "bbox": {"l": 446.6666666666667, "t": 513.0, "r": 473.0, "b": 522.0, "coord_origin": "1"}}, {"id": 662, "text": "templates", "bbox": {"l": 477.3333333333333, "t": 513.0, "r": 515.0, "b": 522.0, "coord_origin": "1"}}, {"id": 663, "text": "is", "bbox": {"l": 519.6666666666666, "t": 513.0, "r": 525.3333333333334, "b": 520.0, "coord_origin": "1"}}, {"id": 664, "text": "first", "bbox": {"l": 530.0, "t": 513.0, "r": 544.6666666666666, "b": 520.0, "coord_origin": "1"}}, {"id": 665, "text": "manually", "bbox": {"l": 309.0, "t": 525.0, "r": 345.3333333333333, "b": 534.0, "coord_origin": "1"}}, {"id": 666, "text": "selected.", "bbox": {"l": 350.0, "t": 525.0, "r": 383.6666666666667, "b": 532.0, "coord_origin": "1"}}, {"id": 667, "text": "Then,", "bbox": {"l": 391.3333333333333, "t": 525.0, "r": 413.6666666666667, "b": 532.6666666666666, "coord_origin": "1"}}, {"id": 668, "text": "a", "bbox": {"l": 418.3333333333333, "t": 527.0, "r": 422.3333333333333, "b": 532.0, "coord_origin": "1"}}, {"id": 669, "text": "style", "bbox": {"l": 427.0, "t": 525.0, "r": 445.0, "b": 534.0, "coord_origin": "1"}}, {"id": 670, "text": "is", "bbox": {"l": 449.3333333333333, "t": 525.0, "r": 455.3333333333333, "b": 532.0, "coord_origin": "1"}}, {"id": 671, "text": "randomly", "bbox": {"l": 459.6666666666667, "t": 525.0, "r": 497.3333333333333, "b": 534.0, "coord_origin": "1"}}, {"id": 672, "text": "selected", "bbox": {"l": 502.0, "t": 525.0, "r": 533.3333333333334, "b": 532.0, "coord_origin": "1"}}, {"id": 673, "text": "to", "bbox": {"l": 537.6666666666666, "t": 526.0, "r": 545.0, "b": 532.0, "coord_origin": "1"}}, {"id": 674, "text": "format", "bbox": {"l": 309.3333333333333, "t": 536.3333333333334, "r": 335.0, "b": 543.3333333333334, "coord_origin": "1"}}, {"id": 675, "text": "the", "bbox": {"l": 338.0, "t": 536.3333333333334, "r": 349.6666666666667, "b": 543.3333333333334, "coord_origin": "1"}}, {"id": 676, "text": "appearance", "bbox": {"l": 352.6666666666667, "t": 538.6666666666666, "r": 397.0, "b": 545.6666666666666, "coord_origin": "1"}}, {"id": 677, "text": "of", "bbox": {"l": 400.0, "t": 536.3333333333334, "r": 408.6666666666667, "b": 543.3333333333334, "coord_origin": "1"}}, {"id": 678, "text": "the", "bbox": {"l": 411.0, "t": 536.6666666666666, "r": 422.3333333333333, "b": 543.3333333333334, "coord_origin": "1"}}, {"id": 679, "text": "synthesized", "bbox": {"l": 425.6666666666667, "t": 536.3333333333334, "r": 471.3333333333333, "b": 545.6666666666666, "coord_origin": "1"}}, {"id": 680, "text": "table.", "bbox": {"l": 474.6666666666667, "t": 536.3333333333334, "r": 495.3333333333333, "b": 543.3333333333334, "coord_origin": "1"}}]}, {"id": 14, "label": "Text", "bbox": {"l": 308.32305908203125, "t": 548.5647583007812, "r": 545.078857421875, "b": 606.7564697265625, "coord_origin": "1"}, "confidence": 0.9807284474372864, "cells": [{"id": 681, "text": "5.", "bbox": {"l": 321.0, "t": 549.3333333333334, "r": 327.3333333333333, "b": 556.3333333333334, "coord_origin": "1"}}, {"id": 682, "text": "Render", "bbox": {"l": 335.6666666666667, "t": 549.3333333333334, "r": 364.3333333333333, "b": 556.3333333333334, "coord_origin": "1"}}, {"id": 683, "text": "the", "bbox": {"l": 368.3333333333333, "t": 549.3333333333334, "r": 379.6666666666667, "b": 556.3333333333334, "coord_origin": "1"}}, {"id": 684, "text": "complete", "bbox": {"l": 384.0, "t": 549.3333333333334, "r": 420.0, "b": 558.6666666666666, "coord_origin": "1"}}, {"id": 685, "text": "tables:", "bbox": {"l": 424.6666666666667, "t": 549.3333333333334, "r": 449.6666666666667, "b": 556.3333333333334, "coord_origin": "1"}}, {"id": 686, "text": "The", "bbox": {"l": 456.3333333333333, "t": 549.3333333333334, "r": 471.3333333333333, "b": 556.3333333333334, "coord_origin": "1"}}, {"id": 687, "text": "synthetic", "bbox": {"l": 475.6666666666667, "t": 549.3333333333334, "r": 511.0, "b": 558.3333333333334, "coord_origin": "1"}}, {"id": 688, "text": "table", "bbox": {"l": 515.3333333333334, "t": 549.3333333333334, "r": 534.3333333333334, "b": 556.3333333333334, "coord_origin": "1"}}, {"id": 689, "text": "is", "bbox": {"l": 538.6666666666666, "t": 549.3333333333334, "r": 544.6666666666666, "b": 556.3333333333334, "coord_origin": "1"}}, {"id": 690, "text": "finally", "bbox": {"l": 309.3333333333333, "t": 561.3333333333334, "r": 333.6666666666667, "b": 570.6666666666666, "coord_origin": "1"}}, {"id": 691, "text": "rendered", "bbox": {"l": 338.0, "t": 561.3333333333334, "r": 372.3333333333333, "b": 568.3333333333334, "coord_origin": "1"}}, {"id": 692, "text": "by", "bbox": {"l": 376.6666666666667, "t": 561.3333333333334, "r": 386.0, "b": 570.6666666666666, "coord_origin": "1"}}, {"id": 693, "text": "a", "bbox": {"l": 390.3333333333333, "t": 563.6666666666666, "r": 394.3333333333333, "b": 568.3333333333334, "coord_origin": "1"}}, {"id": 694, "text": "web", "bbox": {"l": 398.6666666666667, "t": 561.3333333333334, "r": 414.3333333333333, "b": 568.3333333333334, "coord_origin": "1"}}, {"id": 695, "text": "browser", "bbox": {"l": 418.6666666666667, "t": 561.3333333333334, "r": 450.3333333333333, "b": 568.3333333333334, "coord_origin": "1"}}, {"id": 696, "text": "engine", "bbox": {"l": 454.0, "t": 561.3333333333334, "r": 480.0, "b": 570.6666666666666, "coord_origin": "1"}}, {"id": 697, "text": "to", "bbox": {"l": 484.3333333333333, "t": 562.6666666666666, "r": 491.6666666666667, "b": 568.3333333333334, "coord_origin": "1"}}, {"id": 698, "text": "generate", "bbox": {"l": 495.6666666666667, "t": 562.6666666666666, "r": 529.0, "b": 570.6666666666666, "coord_origin": "1"}}, {"id": 699, "text": "the", "bbox": {"l": 533.3333333333334, "t": 561.3333333333334, "r": 544.6666666666666, "b": 568.3333333333334, "coord_origin": "1"}}, {"id": 700, "text": "bounding", "bbox": {"l": 309.0, "t": 573.3333333333334, "r": 346.0, "b": 582.6666666666666, "coord_origin": "1"}}, {"id": 701, "text": "boxes", "bbox": {"l": 349.0, "t": 573.3333333333334, "r": 371.6666666666667, "b": 580.3333333333334, "coord_origin": "1"}}, {"id": 702, "text": "for", "bbox": {"l": 375.0, "t": 573.3333333333334, "r": 386.0, "b": 580.3333333333334, "coord_origin": "1"}}, {"id": 703, "text": "each", "bbox": {"l": 388.6666666666667, "t": 573.3333333333334, "r": 406.3333333333333, "b": 580.3333333333334, "coord_origin": "1"}}, {"id": 704, "text": "table", "bbox": {"l": 409.3333333333333, "t": 573.3333333333334, "r": 428.0, "b": 580.3333333333334, "coord_origin": "1"}}, {"id": 705, "text": "cell.", "bbox": {"l": 431.0, "t": 573.3333333333334, "r": 447.0, "b": 580.3333333333334, "coord_origin": "1"}}, {"id": 706, "text": "A", "bbox": {"l": 451.3333333333333, "t": 573.6666666666666, "r": 457.6666666666667, "b": 580.3333333333334, "coord_origin": "1"}}, {"id": 707, "text": "batching", "bbox": {"l": 460.6666666666667, "t": 573.3333333333334, "r": 494.6666666666667, "b": 582.6666666666666, "coord_origin": "1"}}, {"id": 708, "text": "technique", "bbox": {"l": 497.6666666666667, "t": 573.3333333333334, "r": 535.6666666666666, "b": 582.6666666666666, "coord_origin": "1"}}, {"id": 709, "text": "is", "bbox": {"l": 538.6666666666666, "t": 573.3333333333334, "r": 544.6666666666666, "b": 580.3333333333334, "coord_origin": "1"}}, {"id": 710, "text": "utilized", "bbox": {"l": 309.0, "t": 585.3333333333334, "r": 338.3333333333333, "b": 592.3333333333334, "coord_origin": "1"}}, {"id": 711, "text": "to", "bbox": {"l": 342.3333333333333, "t": 586.6666666666666, "r": 349.3333333333333, "b": 592.3333333333334, "coord_origin": "1"}}, {"id": 712, "text": "optimize", "bbox": {"l": 353.3333333333333, "t": 585.3333333333334, "r": 387.3333333333333, "b": 594.6666666666666, "coord_origin": "1"}}, {"id": 713, "text": "the", "bbox": {"l": 391.3333333333333, "t": 585.3333333333334, "r": 402.6666666666667, "b": 592.3333333333334, "coord_origin": "1"}}, {"id": 714, "text": "runtime", "bbox": {"l": 406.6666666666667, "t": 585.3333333333334, "r": 437.0, "b": 592.3333333333334, "coord_origin": "1"}}, {"id": 715, "text": "overhead", "bbox": {"l": 440.6666666666667, "t": 585.3333333333334, "r": 476.3333333333333, "b": 592.3333333333334, "coord_origin": "1"}}, {"id": 716, "text": "of", "bbox": {"l": 480.3333333333333, "t": 585.3333333333334, "r": 488.6666666666667, "b": 592.3333333333334, "coord_origin": "1"}}, {"id": 717, "text": "the", "bbox": {"l": 492.0, "t": 585.3333333333334, "r": 503.3333333333333, "b": 592.3333333333334, "coord_origin": "1"}}, {"id": 718, "text": "rendering", "bbox": {"l": 507.0, "t": 585.3333333333334, "r": 544.6666666666666, "b": 594.6666666666666, "coord_origin": "1"}}, {"id": 719, "text": "process.", "bbox": {"l": 309.0, "t": 599.6666666666666, "r": 340.3333333333333, "b": 606.6666666666666, "coord_origin": "1"}}]}, {"id": 15, "label": "Section-header", "bbox": {"l": 308.37005615234375, "t": 621.5151977539062, "r": 544.79541015625, "b": 646.3232421875, "coord_origin": "1"}, "confidence": 0.9583657383918762, "cells": [{"id": 720, "text": "2.", "bbox": {"l": 309.0, "t": 622.0, "r": 317.3333333333333, "b": 630.3333333333334, "coord_origin": "1"}}, {"id": 721, "text": "Prediction", "bbox": {"l": 323.6666666666667, "t": 622.0, "r": 376.3333333333333, "b": 630.3333333333334, "coord_origin": "1"}}, {"id": 722, "text": "post-processing", "bbox": {"l": 382.6666666666667, "t": 622.0, "r": 461.0, "b": 632.6666666666666, "coord_origin": "1"}}, {"id": 723, "text": "for", "bbox": {"l": 467.0, "t": 622.0, "r": 481.6666666666667, "b": 630.3333333333334, "coord_origin": "1"}}, {"id": 724, "text": "PDF", "bbox": {"l": 487.6666666666667, "t": 622.0, "r": 510.3333333333333, "b": 630.3333333333334, "coord_origin": "1"}}, {"id": 725, "text": "docu-", "bbox": {"l": 516.6666666666666, "t": 622.0, "r": 544.6666666666666, "b": 630.3333333333334, "coord_origin": "1"}}, {"id": 726, "text": "ments", "bbox": {"l": 327.0, "t": 636.6666666666666, "r": 357.0, "b": 644.3333333333334, "coord_origin": "1"}}]}, {"id": 16, "label": "Text", "bbox": {"l": 308.54010009765625, "t": 656.3193359375, "r": 544.7320556640625, "b": 714.0350341796875, "coord_origin": "1"}, "confidence": 0.9851495027542114, "cells": [{"id": 727, "text": "Although", "bbox": {"l": 321.0, "t": 657.0, "r": 358.0, "b": 666.0, "coord_origin": "1"}}, {"id": 728, "text": "TableFormer", "bbox": {"l": 360.3333333333333, "t": 657.0, "r": 411.3333333333333, "b": 664.0, "coord_origin": "1"}}, {"id": 729, "text": "can", "bbox": {"l": 413.3333333333333, "t": 659.0, "r": 426.6666666666667, "b": 664.0, "coord_origin": "1"}}, {"id": 730, "text": "predict", "bbox": {"l": 429.3333333333333, "t": 657.0, "r": 456.3333333333333, "b": 666.0, "coord_origin": "1"}}, {"id": 731, "text": "the", "bbox": {"l": 459.0, "t": 657.0, "r": 470.3333333333333, "b": 664.0, "coord_origin": "1"}}, {"id": 732, "text": "table", "bbox": {"l": 473.0, "t": 657.0, "r": 491.6666666666667, "b": 664.0, "coord_origin": "1"}}, {"id": 733, "text": "structure", "bbox": {"l": 494.3333333333333, "t": 658.3333333333334, "r": 528.3333333333334, "b": 664.0, "coord_origin": "1"}}, {"id": 734, "text": "and", "bbox": {"l": 531.0, "t": 657.0, "r": 544.6666666666666, "b": 664.0, "coord_origin": "1"}}, {"id": 735, "text": "the", "bbox": {"l": 309.0, "t": 669.0, "r": 320.6666666666667, "b": 676.0, "coord_origin": "1"}}, {"id": 736, "text": "bounding", "bbox": {"l": 323.6666666666667, "t": 669.0, "r": 361.0, "b": 678.0, "coord_origin": "1"}}, {"id": 737, "text": "boxes", "bbox": {"l": 364.0, "t": 669.0, "r": 386.3333333333333, "b": 676.0, "coord_origin": "1"}}, {"id": 738, "text": "for", "bbox": {"l": 389.6666666666667, "t": 669.0, "r": 401.0, "b": 676.0, "coord_origin": "1"}}, {"id": 739, "text": "tables", "bbox": {"l": 403.6666666666667, "t": 669.0, "r": 426.3333333333333, "b": 676.0, "coord_origin": "1"}}, {"id": 740, "text": "recognized", "bbox": {"l": 429.3333333333333, "t": 669.0, "r": 472.3333333333333, "b": 678.0, "coord_origin": "1"}}, {"id": 741, "text": "inside", "bbox": {"l": 475.6666666666667, "t": 669.0, "r": 498.6666666666667, "b": 676.0, "coord_origin": "1"}}, {"id": 742, "text": "PDF", "bbox": {"l": 502.0, "t": 669.0, "r": 520.0, "b": 676.0, "coord_origin": "1"}}, {"id": 743, "text": "docu-", "bbox": {"l": 522.6666666666666, "t": 669.0, "r": 544.6666666666666, "b": 676.0, "coord_origin": "1"}}, {"id": 744, "text": "ments,", "bbox": {"l": 309.0, "t": 682.3333333333334, "r": 334.6666666666667, "b": 688.6666666666666, "coord_origin": "1"}}, {"id": 745, "text": "this", "bbox": {"l": 338.6666666666667, "t": 681.0, "r": 352.3333333333333, "b": 688.0, "coord_origin": "1"}}, {"id": 746, "text": "is", "bbox": {"l": 356.0, "t": 681.0, "r": 361.6666666666667, "b": 688.0, "coord_origin": "1"}}, {"id": 747, "text": "not", "bbox": {"l": 365.3333333333333, "t": 682.3333333333334, "r": 377.3333333333333, "b": 688.0, "coord_origin": "1"}}, {"id": 748, "text": "enough", "bbox": {"l": 381.0, "t": 681.0, "r": 409.6666666666667, "b": 690.0, "coord_origin": "1"}}, {"id": 749, "text": "when", "bbox": {"l": 413.3333333333333, "t": 681.0, "r": 434.3333333333333, "b": 688.0, "coord_origin": "1"}}, {"id": 750, "text": "a", "bbox": {"l": 434.6666666666667, "t": 679.6666666666666, "r": 438.6666666666667, "b": 691.6666666666666, "coord_origin": "1"}}, {"id": 751, "text": "full", "bbox": {"l": 445.3333333333333, "t": 681.0, "r": 458.3333333333333, "b": 688.0, "coord_origin": "1"}}, {"id": 752, "text": "reconstruction", "bbox": {"l": 462.0, "t": 681.0, "r": 518.3333333333334, "b": 688.0, "coord_origin": "1"}}, {"id": 753, "text": "of", "bbox": {"l": 521.6666666666666, "t": 681.0, "r": 530.3333333333334, "b": 688.0, "coord_origin": "1"}}, {"id": 754, "text": "the", "bbox": {"l": 533.3333333333334, "t": 681.0, "r": 544.6666666666666, "b": 688.0, "coord_origin": "1"}}, {"id": 755, "text": "original", "bbox": {"l": 309.0, "t": 693.0, "r": 339.3333333333333, "b": 702.0, "coord_origin": "1"}}, {"id": 756, "text": "table", "bbox": {"l": 342.6666666666667, "t": 693.0, "r": 361.3333333333333, "b": 700.0, "coord_origin": "1"}}, {"id": 757, "text": "is", "bbox": {"l": 365.0, "t": 693.0, "r": 370.6666666666667, "b": 700.0, "coord_origin": "1"}}, {"id": 758, "text": "required.", "bbox": {"l": 374.0, "t": 693.0, "r": 408.6666666666667, "b": 702.0, "coord_origin": "1"}}, {"id": 759, "text": "This", "bbox": {"l": 413.0, "t": 693.0, "r": 430.3333333333333, "b": 700.0, "coord_origin": "1"}}, {"id": 760, "text": "happens", "bbox": {"l": 433.6666666666667, "t": 693.0, "r": 465.6666666666667, "b": 702.0, "coord_origin": "1"}}, {"id": 761, "text": "mainly", "bbox": {"l": 469.0, "t": 693.0, "r": 495.6666666666667, "b": 702.0, "coord_origin": "1"}}, {"id": 762, "text": "due", "bbox": {"l": 499.0, "t": 693.0, "r": 512.6666666666666, "b": 700.0, "coord_origin": "1"}}, {"id": 763, "text": "the", "bbox": {"l": 516.3333333333334, "t": 693.0, "r": 527.6666666666666, "b": 700.0, "coord_origin": "1"}}, {"id": 764, "text": "fol-", "bbox": {"l": 531.0, "t": 693.0, "r": 544.6666666666666, "b": 700.0, "coord_origin": "1"}}, {"id": 765, "text": "lowing", "bbox": {"l": 309.3333333333333, "t": 705.0, "r": 336.0, "b": 714.0, "coord_origin": "1"}}, {"id": 766, "text": "reasons:", "bbox": {"l": 339.0, "t": 707.0, "r": 370.6666666666667, "b": 712.0, "coord_origin": "1"}}]}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "Section-header", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "Section-header", "bbox": {"l": 132.81927490234375, "t": 109.81901550292969, "r": 465.6957702636719, "b": 135.33333333333337, "coord_origin": "1"}, "confidence": 0.6151334643363953, "cells": [{"id": 0, "text": "TableFormer:", "bbox": {"l": 133.0, "t": 110.0, "r": 203.0, "b": 118.66666666666663, "coord_origin": "1"}}, {"id": 1, "text": "Table", "bbox": {"l": 207.66666666666666, "t": 110.0, "r": 235.33333333333334, "b": 118.66666666666663, "coord_origin": "1"}}, {"id": 2, "text": "Structure", "bbox": {"l": 239.0, "t": 110.0, "r": 287.3333333333333, "b": 118.66666666666663, "coord_origin": "1"}}, {"id": 3, "text": "Understanding", "bbox": {"l": 290.6666666666667, "t": 110.0, "r": 366.6666666666667, "b": 121.0, "coord_origin": "1"}}, {"id": 4, "text": "with", "bbox": {"l": 370.3333333333333, "t": 110.0, "r": 392.3333333333333, "b": 118.66666666666663, "coord_origin": "1"}}, {"id": 5, "text": "Transformers", "bbox": {"l": 395.6666666666667, "t": 110.0, "r": 465.0, "b": 118.66666666666663, "coord_origin": "1"}}, {"id": 6, "text": "Supplementary", "bbox": {"l": 220.66666666666666, "t": 121.66666666666663, "r": 315.6666666666667, "b": 135.33333333333337, "coord_origin": "1"}}, {"id": 7, "text": "Material", "bbox": {"l": 321.6666666666667, "t": 121.66666666666663, "r": 374.6666666666667, "b": 132.33333333333337, "coord_origin": "1"}}]}, "text": "TableFormer: Table Structure Understanding with Transformers Supplementary Material"}, {"label": "Section-header", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "Section-header", "bbox": {"l": 49.808494567871094, "t": 160.33333333333337, "r": 175.76251220703125, "b": 171.59271240234375, "coord_origin": "1"}, "confidence": 0.9245885610580444, "cells": [{"id": 8, "text": "1.", "bbox": {"l": 51.0, "t": 160.66666666666663, "r": 58.666666666666664, "b": 169.0, "coord_origin": "1"}}, {"id": 9, "text": "Details", "bbox": {"l": 62.333333333333336, "t": 160.33333333333337, "r": 97.0, "b": 169.0, "coord_origin": "1"}}, {"id": 10, "text": "on", "bbox": {"l": 100.33333333333333, "t": 163.0, "r": 112.66666666666667, "b": 169.0, "coord_origin": "1"}}, {"id": 11, "text": "the", "bbox": {"l": 116.0, "t": 160.66666666666663, "r": 131.66666666666666, "b": 169.0, "coord_origin": "1"}}, {"id": 12, "text": "datasets", "bbox": {"l": 135.0, "t": 160.66666666666663, "r": 175.66666666666666, "b": 169.0, "coord_origin": "1"}}]}, "text": "1. Details on the datasets"}, {"label": "Section-header", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "Section-header", "bbox": {"l": 49.78814697265625, "t": 180.33333333333337, "r": 150.2134552001953, "b": 190.48927307128906, "coord_origin": "1"}, "confidence": 0.9166122674942017, "cells": [{"id": 13, "text": "1.1.", "bbox": {"l": 51.0, "t": 180.33333333333337, "r": 66.0, "b": 188.33333333333337, "coord_origin": "1"}}, {"id": 14, "text": "Data", "bbox": {"l": 69.66666666666667, "t": 180.33333333333337, "r": 91.33333333333333, "b": 188.33333333333337, "coord_origin": "1"}}, {"id": 15, "text": "preparation", "bbox": {"l": 94.66666666666667, "t": 180.33333333333337, "r": 150.0, "b": 190.33333333333337, "coord_origin": "1"}}]}, "text": "1.1. Data preparation"}, {"label": "Text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "Text", "bbox": {"l": 49.627410888671875, "t": 198.0, "r": 286.6666666666667, "b": 388.20391845703125, "coord_origin": "1"}, "confidence": 0.9902494549751282, "cells": [{"id": 16, "text": "As", "bbox": {"l": 62.333333333333336, "t": 199.66666666666663, "r": 72.66666666666667, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 17, "text": "a", "bbox": {"l": 74.0, "t": 198.0, "r": 78.0, "b": 210.0, "coord_origin": "1"}}, {"id": 18, "text": "first", "bbox": {"l": 84.33333333333333, "t": 199.33333333333337, "r": 99.0, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 19, "text": "step", "bbox": {"l": 102.66666666666667, "t": 200.66666666666663, "r": 118.0, "b": 208.66666666666663, "coord_origin": "1"}}, {"id": 20, "text": "of", "bbox": {"l": 121.66666666666667, "t": 199.33333333333337, "r": 130.33333333333334, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 21, "text": "our", "bbox": {"l": 133.33333333333334, "t": 201.66666666666663, "r": 146.33333333333334, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 22, "text": "data", "bbox": {"l": 149.33333333333334, "t": 199.33333333333337, "r": 165.66666666666666, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 23, "text": "preparation", "bbox": {"l": 169.33333333333334, "t": 199.33333333333337, "r": 214.0, "b": 208.66666666666663, "coord_origin": "1"}}, {"id": 24, "text": "process,", "bbox": {"l": 217.66666666666666, "t": 201.66666666666663, "r": 249.33333333333334, "b": 208.66666666666663, "coord_origin": "1"}}, {"id": 25, "text": "we", "bbox": {"l": 253.33333333333334, "t": 201.66666666666663, "r": 264.3333333333333, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 26, "text": "have", "bbox": {"l": 268.3333333333333, "t": 199.33333333333337, "r": 286.0, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 27, "text": "calculated", "bbox": {"l": 50.333333333333336, "t": 211.33333333333337, "r": 90.0, "b": 218.33333333333337, "coord_origin": "1"}}, {"id": 28, "text": "statistics", "bbox": {"l": 94.33333333333333, "t": 211.33333333333337, "r": 128.0, "b": 218.33333333333337, "coord_origin": "1"}}, {"id": 29, "text": "over", "bbox": {"l": 132.0, "t": 213.66666666666663, "r": 149.33333333333334, "b": 218.33333333333337, "coord_origin": "1"}}, {"id": 30, "text": "the", "bbox": {"l": 153.0, "t": 211.33333333333337, "r": 164.66666666666666, "b": 218.33333333333337, "coord_origin": "1"}}, {"id": 31, "text": "datasets", "bbox": {"l": 168.66666666666666, "t": 211.33333333333337, "r": 199.66666666666666, "b": 218.33333333333337, "coord_origin": "1"}}, {"id": 32, "text": "across", "bbox": {"l": 204.0, "t": 213.66666666666663, "r": 228.0, "b": 218.33333333333337, "coord_origin": "1"}}, {"id": 33, "text": "the", "bbox": {"l": 232.33333333333334, "t": 211.33333333333337, "r": 244.0, "b": 218.33333333333337, "coord_origin": "1"}}, {"id": 34, "text": "following", "bbox": {"l": 248.33333333333334, "t": 211.33333333333337, "r": 286.0, "b": 220.66666666666663, "coord_origin": "1"}}, {"id": 35, "text": "dimensions:", "bbox": {"l": 50.333333333333336, "t": 223.33333333333337, "r": 97.33333333333333, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 36, "text": "(1)", "bbox": {"l": 102.33333333333333, "t": 223.66666666666663, "r": 113.0, "b": 231.66666666666663, "coord_origin": "1"}}, {"id": 37, "text": "table", "bbox": {"l": 116.66666666666667, "t": 223.33333333333337, "r": 135.33333333333334, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 38, "text": "size", "bbox": {"l": 138.66666666666666, "t": 223.33333333333337, "r": 153.33333333333334, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 39, "text": "measured", "bbox": {"l": 157.0, "t": 223.33333333333337, "r": 194.33333333333334, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 40, "text": "in", "bbox": {"l": 198.0, "t": 223.33333333333337, "r": 205.0, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 41, "text": "the", "bbox": {"l": 208.33333333333334, "t": 223.33333333333337, "r": 220.0, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 42, "text": "number", "bbox": {"l": 223.33333333333334, "t": 223.33333333333337, "r": 253.33333333333334, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 43, "text": "of", "bbox": {"l": 256.3333333333333, "t": 223.33333333333337, "r": 265.0, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 44, "text": "rows", "bbox": {"l": 267.3333333333333, "t": 225.66666666666663, "r": 286.0, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 45, "text": "and", "bbox": {"l": 50.333333333333336, "t": 235.33333333333337, "r": 64.0, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 46, "text": "columns,", "bbox": {"l": 67.66666666666667, "t": 235.33333333333337, "r": 103.66666666666667, "b": 243.33333333333337, "coord_origin": "1"}}, {"id": 47, "text": "(2)", "bbox": {"l": 108.0, "t": 235.33333333333337, "r": 118.66666666666667, "b": 243.66666666666663, "coord_origin": "1"}}, {"id": 48, "text": "complexity", "bbox": {"l": 122.66666666666667, "t": 235.33333333333337, "r": 166.66666666666666, "b": 244.66666666666663, "coord_origin": "1"}}, {"id": 49, "text": "of", "bbox": {"l": 170.66666666666666, "t": 235.33333333333337, "r": 179.0, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 50, "text": "the", "bbox": {"l": 182.33333333333334, "t": 235.33333333333337, "r": 193.66666666666666, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 51, "text": "table,", "bbox": {"l": 197.66666666666666, "t": 235.33333333333337, "r": 218.66666666666666, "b": 243.33333333333337, "coord_origin": "1"}}, {"id": 52, "text": "(3)", "bbox": {"l": 223.0, "t": 235.33333333333337, "r": 234.0, "b": 243.66666666666663, "coord_origin": "1"}}, {"id": 53, "text": "strictness", "bbox": {"l": 238.0, "t": 235.33333333333337, "r": 274.3333333333333, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 54, "text": "of", "bbox": {"l": 278.3333333333333, "t": 235.33333333333337, "r": 286.6666666666667, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 55, "text": "the", "bbox": {"l": 50.333333333333336, "t": 247.33333333333337, "r": 62.0, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 56, "text": "provided", "bbox": {"l": 65.0, "t": 247.33333333333337, "r": 99.66666666666667, "b": 256.66666666666674, "coord_origin": "1"}}, {"id": 57, "text": "HTML", "bbox": {"l": 103.0, "t": 247.33333333333337, "r": 130.66666666666666, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 58, "text": "structure", "bbox": {"l": 133.66666666666666, "t": 248.66666666666663, "r": 167.66666666666666, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 59, "text": "and", "bbox": {"l": 170.66666666666666, "t": 247.33333333333337, "r": 184.66666666666666, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 60, "text": "(4)", "bbox": {"l": 187.66666666666666, "t": 247.33333333333337, "r": 198.66666666666666, "b": 255.66666666666663, "coord_origin": "1"}}, {"id": 61, "text": "completeness", "bbox": {"l": 201.66666666666666, "t": 247.33333333333337, "r": 255.0, "b": 256.66666666666674, "coord_origin": "1"}}, {"id": 62, "text": "(i.e.", "bbox": {"l": 258.3333333333333, "t": 247.33333333333337, "r": 272.6666666666667, "b": 255.66666666666663, "coord_origin": "1"}}, {"id": 63, "text": "no", "bbox": {"l": 276.6666666666667, "t": 249.66666666666663, "r": 286.0, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 64, "text": "omitted", "bbox": {"l": 50.333333333333336, "t": 259.33333333333326, "r": 80.0, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 65, "text": "bounding", "bbox": {"l": 82.66666666666667, "t": 259.33333333333326, "r": 120.0, "b": 268.66666666666674, "coord_origin": "1"}}, {"id": 66, "text": "boxes).", "bbox": {"l": 122.33333333333333, "t": 259.33333333333326, "r": 150.33333333333334, "b": 267.66666666666674, "coord_origin": "1"}}, {"id": 67, "text": "A", "bbox": {"l": 155.0, "t": 259.66666666666674, "r": 158.0, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 68, "text": "table", "bbox": {"l": 163.66666666666666, "t": 259.33333333333326, "r": 182.33333333333334, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 69, "text": "is", "bbox": {"l": 185.0, "t": 259.33333333333326, "r": 191.0, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 70, "text": "considered", "bbox": {"l": 193.33333333333334, "t": 259.33333333333326, "r": 236.0, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 71, "text": "to", "bbox": {"l": 239.0, "t": 260.66666666666674, "r": 246.0, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 72, "text": "be", "bbox": {"l": 248.66666666666666, "t": 259.33333333333326, "r": 257.3333333333333, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 73, "text": "simple", "bbox": {"l": 260.0, "t": 259.33333333333326, "r": 286.0, "b": 268.66666666666674, "coord_origin": "1"}}, {"id": 74, "text": "if", "bbox": {"l": 50.333333333333336, "t": 271.33333333333326, "r": 56.666666666666664, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 75, "text": "it", "bbox": {"l": 59.0, "t": 271.33333333333326, "r": 63.666666666666664, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 76, "text": "does", "bbox": {"l": 66.66666666666667, "t": 271.33333333333326, "r": 84.66666666666667, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 77, "text": "not", "bbox": {"l": 87.66666666666667, "t": 272.66666666666674, "r": 99.66666666666667, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 78, "text": "contain", "bbox": {"l": 102.66666666666667, "t": 271.33333333333326, "r": 131.66666666666666, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 79, "text": "row", "bbox": {"l": 134.66666666666666, "t": 273.66666666666674, "r": 149.33333333333334, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 80, "text": "spans", "bbox": {"l": 152.33333333333334, "t": 273.66666666666674, "r": 174.0, "b": 280.6666666666667, "coord_origin": "1"}}, {"id": 81, "text": "or", "bbox": {"l": 177.0, "t": 273.66666666666674, "r": 185.0, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 82, "text": "column", "bbox": {"l": 187.66666666666666, "t": 271.33333333333326, "r": 217.0, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 83, "text": "spans.", "bbox": {"l": 220.33333333333334, "t": 273.66666666666674, "r": 244.0, "b": 280.6666666666667, "coord_origin": "1"}}, {"id": 84, "text": "Addition-", "bbox": {"l": 248.0, "t": 271.33333333333326, "r": 286.0, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 85, "text": "ally,", "bbox": {"l": 50.333333333333336, "t": 283.0, "r": 66.33333333333333, "b": 292.0, "coord_origin": "1"}}, {"id": 86, "text": "a", "bbox": {"l": 69.33333333333333, "t": 285.0, "r": 73.33333333333333, "b": 290.0, "coord_origin": "1"}}, {"id": 87, "text": "table", "bbox": {"l": 76.0, "t": 283.0, "r": 94.66666666666667, "b": 290.0, "coord_origin": "1"}}, {"id": 88, "text": "has", "bbox": {"l": 97.66666666666667, "t": 283.0, "r": 110.33333333333333, "b": 290.0, "coord_origin": "1"}}, {"id": 89, "text": "a", "bbox": {"l": 113.0, "t": 285.0, "r": 117.0, "b": 290.0, "coord_origin": "1"}}, {"id": 90, "text": "strict", "bbox": {"l": 120.0, "t": 283.0, "r": 139.0, "b": 290.0, "coord_origin": "1"}}, {"id": 91, "text": "HTML", "bbox": {"l": 142.0, "t": 283.0, "r": 169.66666666666666, "b": 290.0, "coord_origin": "1"}}, {"id": 92, "text": "structure", "bbox": {"l": 172.33333333333334, "t": 284.3333333333333, "r": 206.33333333333334, "b": 290.0, "coord_origin": "1"}}, {"id": 93, "text": "if", "bbox": {"l": 209.33333333333334, "t": 283.0, "r": 215.66666666666666, "b": 290.0, "coord_origin": "1"}}, {"id": 94, "text": "every", "bbox": {"l": 217.33333333333334, "t": 285.0, "r": 238.66666666666666, "b": 292.0, "coord_origin": "1"}}, {"id": 95, "text": "row", "bbox": {"l": 241.33333333333334, "t": 285.0, "r": 256.0, "b": 290.0, "coord_origin": "1"}}, {"id": 96, "text": "has", "bbox": {"l": 259.0, "t": 283.0, "r": 271.6666666666667, "b": 290.0, "coord_origin": "1"}}, {"id": 97, "text": "the", "bbox": {"l": 274.3333333333333, "t": 283.0, "r": 286.0, "b": 290.0, "coord_origin": "1"}}, {"id": 98, "text": "same", "bbox": {"l": 50.333333333333336, "t": 297.0, "r": 70.0, "b": 302.0, "coord_origin": "1"}}, {"id": 99, "text": "number", "bbox": {"l": 73.66666666666667, "t": 295.0, "r": 103.66666666666667, "b": 302.0, "coord_origin": "1"}}, {"id": 100, "text": "of", "bbox": {"l": 106.66666666666667, "t": 295.0, "r": 115.33333333333333, "b": 302.0, "coord_origin": "1"}}, {"id": 101, "text": "columns", "bbox": {"l": 117.66666666666667, "t": 295.0, "r": 150.66666666666666, "b": 302.0, "coord_origin": "1"}}, {"id": 102, "text": "after", "bbox": {"l": 154.0, "t": 295.0, "r": 172.0, "b": 302.0, "coord_origin": "1"}}, {"id": 103, "text": "taking", "bbox": {"l": 175.0, "t": 295.0, "r": 199.33333333333334, "b": 304.0, "coord_origin": "1"}}, {"id": 104, "text": "into", "bbox": {"l": 202.66666666666666, "t": 295.0, "r": 217.66666666666666, "b": 302.0, "coord_origin": "1"}}, {"id": 105, "text": "account", "bbox": {"l": 220.66666666666666, "t": 296.3333333333333, "r": 251.0, "b": 302.0, "coord_origin": "1"}}, {"id": 106, "text": "any", "bbox": {"l": 254.33333333333334, "t": 297.0, "r": 268.0, "b": 304.0, "coord_origin": "1"}}, {"id": 107, "text": "row", "bbox": {"l": 271.3333333333333, "t": 297.0, "r": 286.0, "b": 302.0, "coord_origin": "1"}}, {"id": 108, "text": "or", "bbox": {"l": 50.333333333333336, "t": 309.0, "r": 58.333333333333336, "b": 314.0, "coord_origin": "1"}}, {"id": 109, "text": "column", "bbox": {"l": 61.333333333333336, "t": 307.0, "r": 90.66666666666667, "b": 314.0, "coord_origin": "1"}}, {"id": 110, "text": "spans.", "bbox": {"l": 94.66666666666667, "t": 309.0, "r": 118.0, "b": 316.0, "coord_origin": "1"}}, {"id": 111, "text": "Therefore", "bbox": {"l": 123.33333333333333, "t": 307.0, "r": 162.0, "b": 314.0, "coord_origin": "1"}}, {"id": 112, "text": "a", "bbox": {"l": 165.66666666666666, "t": 309.0, "r": 169.66666666666666, "b": 314.0, "coord_origin": "1"}}, {"id": 113, "text": "strict", "bbox": {"l": 173.33333333333334, "t": 307.0, "r": 192.33333333333334, "b": 314.0, "coord_origin": "1"}}, {"id": 114, "text": "HTML", "bbox": {"l": 196.0, "t": 307.0, "r": 223.66666666666666, "b": 314.0, "coord_origin": "1"}}, {"id": 115, "text": "structure", "bbox": {"l": 227.33333333333334, "t": 308.3333333333333, "r": 261.3333333333333, "b": 314.0, "coord_origin": "1"}}, {"id": 116, "text": "looks", "bbox": {"l": 265.0, "t": 307.0, "r": 286.0, "b": 314.0, "coord_origin": "1"}}, {"id": 117, "text": "always", "bbox": {"l": 50.333333333333336, "t": 319.0, "r": 77.33333333333333, "b": 328.0, "coord_origin": "1"}}, {"id": 118, "text": "rectangular.", "bbox": {"l": 80.66666666666667, "t": 319.0, "r": 126.33333333333333, "b": 328.0, "coord_origin": "1"}}, {"id": 119, "text": "However,", "bbox": {"l": 131.66666666666666, "t": 319.0, "r": 168.66666666666666, "b": 326.6666666666667, "coord_origin": "1"}}, {"id": 120, "text": "HTML", "bbox": {"l": 172.33333333333334, "t": 319.0, "r": 200.0, "b": 326.0, "coord_origin": "1"}}, {"id": 121, "text": "is", "bbox": {"l": 203.66666666666666, "t": 319.0, "r": 209.33333333333334, "b": 326.0, "coord_origin": "1"}}, {"id": 122, "text": "a", "bbox": {"l": 211.33333333333334, "t": 317.6666666666667, "r": 214.33333333333334, "b": 329.3333333333333, "coord_origin": "1"}}, {"id": 123, "text": "lenient", "bbox": {"l": 220.33333333333334, "t": 319.0, "r": 246.66666666666666, "b": 326.0, "coord_origin": "1"}}, {"id": 124, "text": "encoding", "bbox": {"l": 250.0, "t": 319.0, "r": 286.0, "b": 328.0, "coord_origin": "1"}}, {"id": 125, "text": "format,", "bbox": {"l": 50.666666666666664, "t": 331.0, "r": 78.66666666666667, "b": 338.6666666666667, "coord_origin": "1"}}, {"id": 126, "text": "i.e.", "bbox": {"l": 83.33333333333333, "t": 331.0, "r": 94.66666666666667, "b": 338.0, "coord_origin": "1"}}, {"id": 127, "text": "tables", "bbox": {"l": 101.66666666666667, "t": 331.0, "r": 124.33333333333333, "b": 338.0, "coord_origin": "1"}}, {"id": 128, "text": "with", "bbox": {"l": 128.66666666666666, "t": 331.0, "r": 145.66666666666666, "b": 338.0, "coord_origin": "1"}}, {"id": 129, "text": "rows", "bbox": {"l": 149.66666666666666, "t": 333.0, "r": 168.33333333333334, "b": 338.0, "coord_origin": "1"}}, {"id": 130, "text": "of", "bbox": {"l": 172.33333333333334, "t": 331.0, "r": 181.0, "b": 338.0, "coord_origin": "1"}}, {"id": 131, "text": "different", "bbox": {"l": 184.33333333333334, "t": 331.0, "r": 217.66666666666666, "b": 338.0, "coord_origin": "1"}}, {"id": 132, "text": "sizes", "bbox": {"l": 222.0, "t": 331.0, "r": 240.66666666666666, "b": 338.0, "coord_origin": "1"}}, {"id": 133, "text": "might", "bbox": {"l": 245.0, "t": 331.0, "r": 267.6666666666667, "b": 340.0, "coord_origin": "1"}}, {"id": 134, "text": "still", "bbox": {"l": 271.6666666666667, "t": 331.0, "r": 286.0, "b": 338.0, "coord_origin": "1"}}, {"id": 135, "text": "be", "bbox": {"l": 50.333333333333336, "t": 343.0, "r": 59.0, "b": 350.0, "coord_origin": "1"}}, {"id": 136, "text": "regarded", "bbox": {"l": 62.666666666666664, "t": 343.0, "r": 96.66666666666667, "b": 352.0, "coord_origin": "1"}}, {"id": 137, "text": "as", "bbox": {"l": 100.33333333333333, "t": 345.0, "r": 108.0, "b": 350.0, "coord_origin": "1"}}, {"id": 138, "text": "correct", "bbox": {"l": 111.66666666666667, "t": 344.3333333333333, "r": 138.66666666666666, "b": 350.0, "coord_origin": "1"}}, {"id": 139, "text": "due", "bbox": {"l": 142.33333333333334, "t": 343.0, "r": 156.0, "b": 350.0, "coord_origin": "1"}}, {"id": 140, "text": "to", "bbox": {"l": 159.66666666666666, "t": 344.3333333333333, "r": 167.0, "b": 350.0, "coord_origin": "1"}}, {"id": 141, "text": "implicit", "bbox": {"l": 170.66666666666666, "t": 343.0, "r": 201.0, "b": 352.0, "coord_origin": "1"}}, {"id": 142, "text": "display", "bbox": {"l": 204.33333333333334, "t": 343.0, "r": 232.33333333333334, "b": 352.0, "coord_origin": "1"}}, {"id": 143, "text": "rules.", "bbox": {"l": 236.33333333333334, "t": 343.0, "r": 257.3333333333333, "b": 350.0, "coord_origin": "1"}}, {"id": 144, "text": "These", "bbox": {"l": 262.6666666666667, "t": 343.0, "r": 286.0, "b": 350.0, "coord_origin": "1"}}, {"id": 145, "text": "implicit", "bbox": {"l": 50.333333333333336, "t": 355.0, "r": 80.66666666666667, "b": 364.0, "coord_origin": "1"}}, {"id": 146, "text": "rules", "bbox": {"l": 84.33333333333333, "t": 355.0, "r": 103.33333333333333, "b": 362.0, "coord_origin": "1"}}, {"id": 147, "text": "leave", "bbox": {"l": 107.0, "t": 355.0, "r": 126.66666666666667, "b": 362.0, "coord_origin": "1"}}, {"id": 148, "text": "room", "bbox": {"l": 130.33333333333334, "t": 357.0, "r": 151.0, "b": 362.0, "coord_origin": "1"}}, {"id": 149, "text": "for", "bbox": {"l": 154.66666666666666, "t": 355.0, "r": 165.66666666666666, "b": 362.0, "coord_origin": "1"}}, {"id": 150, "text": "ambiguity,", "bbox": {"l": 169.0, "t": 355.0, "r": 210.66666666666666, "b": 364.0, "coord_origin": "1"}}, {"id": 151, "text": "which", "bbox": {"l": 214.66666666666666, "t": 355.0, "r": 238.33333333333334, "b": 362.0, "coord_origin": "1"}}, {"id": 152, "text": "we", "bbox": {"l": 242.0, "t": 357.0, "r": 252.66666666666666, "b": 362.0, "coord_origin": "1"}}, {"id": 153, "text": "want", "bbox": {"l": 256.6666666666667, "t": 356.3333333333333, "r": 275.3333333333333, "b": 362.0, "coord_origin": "1"}}, {"id": 154, "text": "to", "bbox": {"l": 279.0, "t": 356.3333333333333, "r": 286.0, "b": 362.0, "coord_origin": "1"}}, {"id": 155, "text": "avoid.", "bbox": {"l": 50.333333333333336, "t": 367.0, "r": 73.66666666666667, "b": 374.0, "coord_origin": "1"}}, {"id": 156, "text": "As", "bbox": {"l": 78.0, "t": 367.0, "r": 88.66666666666667, "b": 374.0, "coord_origin": "1"}}, {"id": 157, "text": "such,", "bbox": {"l": 92.0, "t": 367.0, "r": 112.0, "b": 374.6666666666667, "coord_origin": "1"}}, {"id": 158, "text": "we", "bbox": {"l": 115.66666666666667, "t": 369.0, "r": 126.33333333333333, "b": 374.0, "coord_origin": "1"}}, {"id": 159, "text": "prefer", "bbox": {"l": 129.66666666666666, "t": 367.0, "r": 153.33333333333334, "b": 376.0, "coord_origin": "1"}}, {"id": 160, "text": "to", "bbox": {"l": 156.33333333333334, "t": 368.3333333333333, "r": 163.33333333333334, "b": 374.0, "coord_origin": "1"}}, {"id": 161, "text": "have", "bbox": {"l": 166.33333333333334, "t": 367.0, "r": 184.33333333333334, "b": 374.0, "coord_origin": "1"}}, {"id": 162, "text": "\u201cstrict\u201d", "bbox": {"l": 187.66666666666666, "t": 367.0, "r": 215.66666666666666, "b": 374.0, "coord_origin": "1"}}, {"id": 163, "text": "tables,", "bbox": {"l": 219.0, "t": 367.0, "r": 244.0, "b": 374.6666666666667, "coord_origin": "1"}}, {"id": 164, "text": "i.e.", "bbox": {"l": 247.66666666666666, "t": 367.0, "r": 258.6666666666667, "b": 374.0, "coord_origin": "1"}}, {"id": 165, "text": "tables", "bbox": {"l": 263.3333333333333, "t": 367.0, "r": 286.0, "b": 374.0, "coord_origin": "1"}}, {"id": 166, "text": "where", "bbox": {"l": 50.333333333333336, "t": 379.0, "r": 74.0, "b": 386.0, "coord_origin": "1"}}, {"id": 167, "text": "every", "bbox": {"l": 77.0, "t": 381.0, "r": 98.0, "b": 388.0, "coord_origin": "1"}}, {"id": 168, "text": "row", "bbox": {"l": 101.33333333333333, "t": 381.0, "r": 116.0, "b": 386.0, "coord_origin": "1"}}, {"id": 169, "text": "has", "bbox": {"l": 119.0, "t": 379.0, "r": 131.66666666666666, "b": 386.0, "coord_origin": "1"}}, {"id": 170, "text": "exactly", "bbox": {"l": 134.66666666666666, "t": 379.0, "r": 162.66666666666666, "b": 388.0, "coord_origin": "1"}}, {"id": 171, "text": "the", "bbox": {"l": 166.0, "t": 379.0, "r": 177.66666666666666, "b": 386.0, "coord_origin": "1"}}, {"id": 172, "text": "same", "bbox": {"l": 180.66666666666666, "t": 381.0, "r": 200.66666666666666, "b": 386.0, "coord_origin": "1"}}, {"id": 173, "text": "length.", "bbox": {"l": 203.66666666666666, "t": 379.0, "r": 230.0, "b": 388.0, "coord_origin": "1"}}]}, "text": "As a first step of our data preparation process, we have calculated statistics over the datasets across the following dimensions: (1) table size measured in the number of rows and columns, (2) complexity of the table, (3) strictness of the provided HTML structure and (4) completeness (i.e. no omitted bounding boxes). A table is considered to be simple if it does not contain row spans or column spans. Additionally, a table has a strict HTML structure if every row has the same number of columns after taking into account any row or column spans. Therefore a strict HTML structure looks always rectangular. However, HTML is a lenient encoding format, i.e. tables with rows of different sizes might still be regarded as correct due to implicit display rules. These implicit rules leave room for ambiguity, which we want to avoid. As such, we prefer to have \u201cstrict\u201d tables, i.e. tables where every row has exactly the same length."}, {"label": "Text", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "Text", "bbox": {"l": 49.640533447265625, "t": 390.59295654296875, "r": 286.6666666666667, "b": 627.3333333333334, "coord_origin": "1"}, "confidence": 0.987933337688446, "cells": [{"id": 174, "text": "We", "bbox": {"l": 62.333333333333336, "t": 391.0, "r": 74.66666666666667, "b": 398.0, "coord_origin": "1"}}, {"id": 175, "text": "have", "bbox": {"l": 80.0, "t": 391.0, "r": 97.66666666666667, "b": 398.0, "coord_origin": "1"}}, {"id": 176, "text": "developed", "bbox": {"l": 102.66666666666667, "t": 391.0, "r": 142.66666666666666, "b": 400.0, "coord_origin": "1"}}, {"id": 177, "text": "a", "bbox": {"l": 147.66666666666666, "t": 393.0, "r": 151.66666666666666, "b": 398.0, "coord_origin": "1"}}, {"id": 178, "text": "technique", "bbox": {"l": 156.66666666666666, "t": 391.0, "r": 194.66666666666666, "b": 400.0, "coord_origin": "1"}}, {"id": 179, "text": "that", "bbox": {"l": 200.0, "t": 391.0, "r": 214.33333333333334, "b": 398.0, "coord_origin": "1"}}, {"id": 180, "text": "tries", "bbox": {"l": 219.33333333333334, "t": 391.0, "r": 235.66666666666666, "b": 398.0, "coord_origin": "1"}}, {"id": 181, "text": "to", "bbox": {"l": 241.0, "t": 392.3333333333333, "r": 248.33333333333334, "b": 398.0, "coord_origin": "1"}}, {"id": 182, "text": "derive", "bbox": {"l": 253.0, "t": 391.0, "r": 277.0, "b": 398.0, "coord_origin": "1"}}, {"id": 183, "text": "a", "bbox": {"l": 282.3333333333333, "t": 393.0, "r": 286.3333333333333, "b": 398.0, "coord_origin": "1"}}, {"id": 184, "text": "missing", "bbox": {"l": 50.333333333333336, "t": 403.0, "r": 80.66666666666667, "b": 412.0, "coord_origin": "1"}}, {"id": 185, "text": "bounding", "bbox": {"l": 84.33333333333333, "t": 403.0, "r": 121.33333333333333, "b": 412.0, "coord_origin": "1"}}, {"id": 186, "text": "box", "bbox": {"l": 125.0, "t": 403.0, "r": 139.0, "b": 410.0, "coord_origin": "1"}}, {"id": 187, "text": "out", "bbox": {"l": 142.66666666666666, "t": 404.3333333333333, "r": 155.0, "b": 410.0, "coord_origin": "1"}}, {"id": 188, "text": "of", "bbox": {"l": 158.33333333333334, "t": 403.0, "r": 167.0, "b": 410.0, "coord_origin": "1"}}, {"id": 189, "text": "its", "bbox": {"l": 169.66666666666666, "t": 403.0, "r": 178.66666666666666, "b": 410.0, "coord_origin": "1"}}, {"id": 190, "text": "neighbors.", "bbox": {"l": 182.0, "t": 403.0, "r": 222.66666666666666, "b": 412.0, "coord_origin": "1"}}, {"id": 191, "text": "As", "bbox": {"l": 228.33333333333334, "t": 403.0, "r": 238.66666666666666, "b": 410.0, "coord_origin": "1"}}, {"id": 192, "text": "a", "bbox": {"l": 239.33333333333334, "t": 401.6666666666667, "r": 243.66666666666666, "b": 413.3333333333333, "coord_origin": "1"}}, {"id": 193, "text": "first", "bbox": {"l": 250.0, "t": 403.0, "r": 264.6666666666667, "b": 410.0, "coord_origin": "1"}}, {"id": 194, "text": "step,", "bbox": {"l": 268.3333333333333, "t": 404.3333333333333, "r": 285.6666666666667, "b": 412.0, "coord_origin": "1"}}, {"id": 195, "text": "we", "bbox": {"l": 50.333333333333336, "t": 417.0, "r": 61.333333333333336, "b": 422.0, "coord_origin": "1"}}, {"id": 196, "text": "use", "bbox": {"l": 64.33333333333333, "t": 417.0, "r": 76.66666666666667, "b": 422.0, "coord_origin": "1"}}, {"id": 197, "text": "the", "bbox": {"l": 79.66666666666667, "t": 415.0, "r": 91.0, "b": 422.0, "coord_origin": "1"}}, {"id": 198, "text": "annotation", "bbox": {"l": 94.0, "t": 415.0, "r": 135.33333333333334, "b": 422.0, "coord_origin": "1"}}, {"id": 199, "text": "data", "bbox": {"l": 138.0, "t": 415.0, "r": 154.33333333333334, "b": 422.0, "coord_origin": "1"}}, {"id": 200, "text": "to", "bbox": {"l": 156.66666666666666, "t": 416.3333333333333, "r": 164.0, "b": 422.0, "coord_origin": "1"}}, {"id": 201, "text": "generate", "bbox": {"l": 166.66666666666666, "t": 416.3333333333333, "r": 199.66666666666666, "b": 424.0, "coord_origin": "1"}}, {"id": 202, "text": "the", "bbox": {"l": 202.66666666666666, "t": 415.0, "r": 214.0, "b": 422.0, "coord_origin": "1"}}, {"id": 203, "text": "most", "bbox": {"l": 217.0, "t": 416.3333333333333, "r": 235.66666666666666, "b": 422.0, "coord_origin": "1"}}, {"id": 204, "text": "fine-grained", "bbox": {"l": 238.66666666666666, "t": 415.0, "r": 286.0, "b": 424.0, "coord_origin": "1"}}, {"id": 205, "text": "grid", "bbox": {"l": 50.333333333333336, "t": 427.0, "r": 65.66666666666667, "b": 436.0, "coord_origin": "1"}}, {"id": 206, "text": "that", "bbox": {"l": 69.33333333333333, "t": 427.0, "r": 83.33333333333333, "b": 434.0, "coord_origin": "1"}}, {"id": 207, "text": "covers", "bbox": {"l": 86.66666666666667, "t": 429.0, "r": 112.0, "b": 434.0, "coord_origin": "1"}}, {"id": 208, "text": "the", "bbox": {"l": 115.33333333333333, "t": 427.0, "r": 126.66666666666667, "b": 434.0, "coord_origin": "1"}}, {"id": 209, "text": "table", "bbox": {"l": 130.33333333333334, "t": 427.0, "r": 149.0, "b": 434.0, "coord_origin": "1"}}, {"id": 210, "text": "structure.", "bbox": {"l": 152.66666666666666, "t": 428.3333333333333, "r": 188.66666666666666, "b": 434.0, "coord_origin": "1"}}, {"id": 211, "text": "In", "bbox": {"l": 193.66666666666666, "t": 427.0, "r": 201.33333333333334, "b": 434.0, "coord_origin": "1"}}, {"id": 212, "text": "case", "bbox": {"l": 204.66666666666666, "t": 429.0, "r": 221.33333333333334, "b": 434.0, "coord_origin": "1"}}, {"id": 213, "text": "of", "bbox": {"l": 224.66666666666666, "t": 427.0, "r": 233.0, "b": 434.0, "coord_origin": "1"}}, {"id": 214, "text": "strict", "bbox": {"l": 235.66666666666666, "t": 427.0, "r": 255.0, "b": 434.0, "coord_origin": "1"}}, {"id": 215, "text": "HTML", "bbox": {"l": 258.3333333333333, "t": 427.0, "r": 286.0, "b": 434.0, "coord_origin": "1"}}, {"id": 216, "text": "tables,", "bbox": {"l": 50.333333333333336, "t": 439.0, "r": 75.33333333333333, "b": 446.6666666666667, "coord_origin": "1"}}, {"id": 217, "text": "all", "bbox": {"l": 79.66666666666667, "t": 439.0, "r": 88.66666666666667, "b": 446.0, "coord_origin": "1"}}, {"id": 218, "text": "grid", "bbox": {"l": 92.66666666666667, "t": 439.0, "r": 108.0, "b": 448.0, "coord_origin": "1"}}, {"id": 219, "text": "squares", "bbox": {"l": 112.0, "t": 441.0, "r": 141.33333333333334, "b": 448.0, "coord_origin": "1"}}, {"id": 220, "text": "are", "bbox": {"l": 145.0, "t": 441.0, "r": 156.33333333333334, "b": 446.0, "coord_origin": "1"}}, {"id": 221, "text": "associated", "bbox": {"l": 160.33333333333334, "t": 439.0, "r": 200.66666666666666, "b": 446.0, "coord_origin": "1"}}, {"id": 222, "text": "with", "bbox": {"l": 204.66666666666666, "t": 439.0, "r": 221.66666666666666, "b": 446.0, "coord_origin": "1"}}, {"id": 223, "text": "some", "bbox": {"l": 225.66666666666666, "t": 441.0, "r": 245.66666666666666, "b": 446.0, "coord_origin": "1"}}, {"id": 224, "text": "table", "bbox": {"l": 249.66666666666666, "t": 439.0, "r": 268.3333333333333, "b": 446.0, "coord_origin": "1"}}, {"id": 225, "text": "cell", "bbox": {"l": 272.0, "t": 439.0, "r": 286.0, "b": 446.0, "coord_origin": "1"}}, {"id": 226, "text": "and", "bbox": {"l": 50.333333333333336, "t": 451.0, "r": 64.0, "b": 458.0, "coord_origin": "1"}}, {"id": 227, "text": "in", "bbox": {"l": 67.0, "t": 451.0, "r": 74.0, "b": 458.0, "coord_origin": "1"}}, {"id": 228, "text": "the", "bbox": {"l": 77.0, "t": 451.0, "r": 88.33333333333333, "b": 458.0, "coord_origin": "1"}}, {"id": 229, "text": "presence", "bbox": {"l": 91.33333333333333, "t": 453.0, "r": 125.33333333333333, "b": 460.0, "coord_origin": "1"}}, {"id": 230, "text": "of", "bbox": {"l": 128.33333333333334, "t": 451.0, "r": 137.0, "b": 458.0, "coord_origin": "1"}}, {"id": 231, "text": "table", "bbox": {"l": 139.0, "t": 451.0, "r": 157.66666666666666, "b": 458.0, "coord_origin": "1"}}, {"id": 232, "text": "spans", "bbox": {"l": 160.66666666666666, "t": 453.0, "r": 182.0, "b": 460.3333333333333, "coord_origin": "1"}}, {"id": 233, "text": "a", "bbox": {"l": 184.66666666666666, "t": 453.0, "r": 189.0, "b": 458.0, "coord_origin": "1"}}, {"id": 234, "text": "cell", "bbox": {"l": 191.33333333333334, "t": 451.0, "r": 205.0, "b": 458.0, "coord_origin": "1"}}, {"id": 235, "text": "extends", "bbox": {"l": 208.0, "t": 451.0, "r": 237.66666666666666, "b": 458.0, "coord_origin": "1"}}, {"id": 236, "text": "across", "bbox": {"l": 240.66666666666666, "t": 453.0, "r": 265.0, "b": 458.0, "coord_origin": "1"}}, {"id": 237, "text": "mul-", "bbox": {"l": 268.0, "t": 451.0, "r": 286.0, "b": 458.0, "coord_origin": "1"}}, {"id": 238, "text": "tiple", "bbox": {"l": 50.333333333333336, "t": 462.6666666666667, "r": 67.33333333333333, "b": 471.6666666666667, "coord_origin": "1"}}, {"id": 239, "text": "grid", "bbox": {"l": 70.0, "t": 462.6666666666667, "r": 85.33333333333333, "b": 471.6666666666667, "coord_origin": "1"}}, {"id": 240, "text": "squares.", "bbox": {"l": 88.33333333333333, "t": 464.6666666666667, "r": 119.66666666666667, "b": 471.6666666666667, "coord_origin": "1"}}, {"id": 241, "text": "When", "bbox": {"l": 123.33333333333333, "t": 462.6666666666667, "r": 146.66666666666666, "b": 469.3333333333333, "coord_origin": "1"}}, {"id": 242, "text": "enough", "bbox": {"l": 149.33333333333334, "t": 462.6666666666667, "r": 178.0, "b": 471.6666666666667, "coord_origin": "1"}}, {"id": 243, "text": "bounding", "bbox": {"l": 180.66666666666666, "t": 462.6666666666667, "r": 217.66666666666666, "b": 471.6666666666667, "coord_origin": "1"}}, {"id": 244, "text": "boxes", "bbox": {"l": 220.33333333333334, "t": 462.6666666666667, "r": 243.0, "b": 469.3333333333333, "coord_origin": "1"}}, {"id": 245, "text": "are", "bbox": {"l": 245.66666666666666, "t": 464.6666666666667, "r": 257.0, "b": 469.3333333333333, "coord_origin": "1"}}, {"id": 246, "text": "known", "bbox": {"l": 259.6666666666667, "t": 462.6666666666667, "r": 286.0, "b": 469.3333333333333, "coord_origin": "1"}}, {"id": 247, "text": "for", "bbox": {"l": 50.666666666666664, "t": 474.6666666666667, "r": 61.666666666666664, "b": 481.3333333333333, "coord_origin": "1"}}, {"id": 248, "text": "a", "bbox": {"l": 65.66666666666667, "t": 476.6666666666667, "r": 69.66666666666667, "b": 481.3333333333333, "coord_origin": "1"}}, {"id": 249, "text": "rectangular", "bbox": {"l": 73.66666666666667, "t": 474.6666666666667, "r": 118.33333333333333, "b": 483.6666666666667, "coord_origin": "1"}}, {"id": 250, "text": "table,", "bbox": {"l": 122.0, "t": 474.6666666666667, "r": 143.33333333333334, "b": 482.3333333333333, "coord_origin": "1"}}, {"id": 251, "text": "it", "bbox": {"l": 148.0, "t": 474.6666666666667, "r": 152.66666666666666, "b": 481.3333333333333, "coord_origin": "1"}}, {"id": 252, "text": "is", "bbox": {"l": 157.33333333333334, "t": 474.6666666666667, "r": 163.33333333333334, "b": 481.3333333333333, "coord_origin": "1"}}, {"id": 253, "text": "possible", "bbox": {"l": 167.33333333333334, "t": 474.6666666666667, "r": 199.33333333333334, "b": 483.6666666666667, "coord_origin": "1"}}, {"id": 254, "text": "to", "bbox": {"l": 203.66666666666666, "t": 475.6666666666667, "r": 211.0, "b": 481.3333333333333, "coord_origin": "1"}}, {"id": 255, "text": "compute", "bbox": {"l": 215.0, "t": 475.6666666666667, "r": 248.66666666666666, "b": 483.6666666666667, "coord_origin": "1"}}, {"id": 256, "text": "the", "bbox": {"l": 253.33333333333334, "t": 474.6666666666667, "r": 264.6666666666667, "b": 481.3333333333333, "coord_origin": "1"}}, {"id": 257, "text": "geo-", "bbox": {"l": 268.6666666666667, "t": 476.6666666666667, "r": 286.0, "b": 483.6666666666667, "coord_origin": "1"}}, {"id": 258, "text": "metrical", "bbox": {"l": 50.333333333333336, "t": 486.6666666666667, "r": 82.33333333333333, "b": 493.6666666666667, "coord_origin": "1"}}, {"id": 259, "text": "border", "bbox": {"l": 86.33333333333333, "t": 486.6666666666667, "r": 112.33333333333333, "b": 493.3333333333333, "coord_origin": "1"}}, {"id": 260, "text": "lines", "bbox": {"l": 116.0, "t": 486.6666666666667, "r": 134.0, "b": 493.3333333333333, "coord_origin": "1"}}, {"id": 261, "text": "between", "bbox": {"l": 138.0, "t": 486.6666666666667, "r": 170.66666666666666, "b": 493.3333333333333, "coord_origin": "1"}}, {"id": 262, "text": "the", "bbox": {"l": 174.66666666666666, "t": 486.6666666666667, "r": 186.33333333333334, "b": 493.3333333333333, "coord_origin": "1"}}, {"id": 263, "text": "grid", "bbox": {"l": 190.33333333333334, "t": 486.6666666666667, "r": 206.0, "b": 495.6666666666667, "coord_origin": "1"}}, {"id": 264, "text": "rows", "bbox": {"l": 210.0, "t": 488.6666666666667, "r": 228.33333333333334, "b": 493.3333333333333, "coord_origin": "1"}}, {"id": 265, "text": "and", "bbox": {"l": 232.33333333333334, "t": 486.6666666666667, "r": 246.33333333333334, "b": 493.3333333333333, "coord_origin": "1"}}, {"id": 266, "text": "columns.", "bbox": {"l": 250.33333333333334, "t": 486.6666666666667, "r": 285.6666666666667, "b": 493.6666666666667, "coord_origin": "1"}}, {"id": 267, "text": "Eventually", "bbox": {"l": 50.333333333333336, "t": 498.6666666666667, "r": 92.66666666666667, "b": 507.6666666666667, "coord_origin": "1"}}, {"id": 268, "text": "this", "bbox": {"l": 96.33333333333333, "t": 498.6666666666667, "r": 110.0, "b": 505.3333333333333, "coord_origin": "1"}}, {"id": 269, "text": "information", "bbox": {"l": 113.33333333333333, "t": 498.6666666666667, "r": 159.66666666666666, "b": 505.3333333333333, "coord_origin": "1"}}, {"id": 270, "text": "is", "bbox": {"l": 163.33333333333334, "t": 498.6666666666667, "r": 169.0, "b": 505.3333333333333, "coord_origin": "1"}}, {"id": 271, "text": "used", "bbox": {"l": 172.66666666666666, "t": 498.6666666666667, "r": 190.0, "b": 505.6666666666667, "coord_origin": "1"}}, {"id": 272, "text": "to", "bbox": {"l": 193.66666666666666, "t": 499.6666666666667, "r": 200.66666666666666, "b": 505.3333333333333, "coord_origin": "1"}}, {"id": 273, "text": "generate", "bbox": {"l": 204.0, "t": 500.0, "r": 237.33333333333334, "b": 507.6666666666667, "coord_origin": "1"}}, {"id": 274, "text": "the", "bbox": {"l": 240.66666666666666, "t": 498.6666666666667, "r": 252.0, "b": 505.6666666666667, "coord_origin": "1"}}, {"id": 275, "text": "missing", "bbox": {"l": 255.66666666666666, "t": 498.6666666666667, "r": 286.0, "b": 507.6666666666667, "coord_origin": "1"}}, {"id": 276, "text": "bounding", "bbox": {"l": 50.333333333333336, "t": 510.6666666666667, "r": 87.33333333333333, "b": 519.6666666666666, "coord_origin": "1"}}, {"id": 277, "text": "boxes.", "bbox": {"l": 90.66666666666667, "t": 510.6666666666667, "r": 115.33333333333333, "b": 517.6666666666666, "coord_origin": "1"}}, {"id": 278, "text": "Additionally,", "bbox": {"l": 119.66666666666667, "t": 510.6666666666667, "r": 171.0, "b": 519.6666666666666, "coord_origin": "1"}}, {"id": 279, "text": "the", "bbox": {"l": 174.66666666666666, "t": 510.6666666666667, "r": 186.0, "b": 517.6666666666666, "coord_origin": "1"}}, {"id": 280, "text": "existence", "bbox": {"l": 189.0, "t": 510.6666666666667, "r": 225.66666666666666, "b": 517.6666666666666, "coord_origin": "1"}}, {"id": 281, "text": "of", "bbox": {"l": 228.66666666666666, "t": 510.6666666666667, "r": 237.33333333333334, "b": 517.3333333333334, "coord_origin": "1"}}, {"id": 282, "text": "unused", "bbox": {"l": 240.0, "t": 510.6666666666667, "r": 267.3333333333333, "b": 517.6666666666666, "coord_origin": "1"}}, {"id": 283, "text": "grid", "bbox": {"l": 270.3333333333333, "t": 510.6666666666667, "r": 286.0, "b": 519.6666666666666, "coord_origin": "1"}}, {"id": 284, "text": "squares", "bbox": {"l": 50.333333333333336, "t": 524.6666666666666, "r": 79.66666666666667, "b": 531.6666666666666, "coord_origin": "1"}}, {"id": 285, "text": "indicates", "bbox": {"l": 83.33333333333333, "t": 522.6666666666666, "r": 118.0, "b": 529.6666666666666, "coord_origin": "1"}}, {"id": 286, "text": "that", "bbox": {"l": 122.0, "t": 522.6666666666666, "r": 136.33333333333334, "b": 529.6666666666666, "coord_origin": "1"}}, {"id": 287, "text": "the", "bbox": {"l": 140.0, "t": 522.6666666666666, "r": 151.33333333333334, "b": 529.6666666666666, "coord_origin": "1"}}, {"id": 288, "text": "table", "bbox": {"l": 155.33333333333334, "t": 522.6666666666666, "r": 174.0, "b": 529.6666666666666, "coord_origin": "1"}}, {"id": 289, "text": "rows", "bbox": {"l": 177.66666666666666, "t": 524.6666666666666, "r": 196.0, "b": 529.3333333333334, "coord_origin": "1"}}, {"id": 290, "text": "have", "bbox": {"l": 200.0, "t": 522.6666666666666, "r": 217.66666666666666, "b": 529.6666666666666, "coord_origin": "1"}}, {"id": 291, "text": "unequal", "bbox": {"l": 221.66666666666666, "t": 522.6666666666666, "r": 252.33333333333334, "b": 531.6666666666666, "coord_origin": "1"}}, {"id": 292, "text": "number", "bbox": {"l": 256.3333333333333, "t": 522.6666666666666, "r": 286.3333333333333, "b": 529.6666666666666, "coord_origin": "1"}}, {"id": 293, "text": "of", "bbox": {"l": 50.333333333333336, "t": 534.6666666666666, "r": 59.0, "b": 541.3333333333334, "coord_origin": "1"}}, {"id": 294, "text": "columns", "bbox": {"l": 61.0, "t": 534.6666666666666, "r": 94.33333333333333, "b": 541.6666666666666, "coord_origin": "1"}}, {"id": 295, "text": "and", "bbox": {"l": 97.66666666666667, "t": 534.6666666666666, "r": 111.33333333333333, "b": 541.6666666666666, "coord_origin": "1"}}, {"id": 296, "text": "the", "bbox": {"l": 114.66666666666667, "t": 534.6666666666666, "r": 126.33333333333333, "b": 541.6666666666666, "coord_origin": "1"}}, {"id": 297, "text": "overall", "bbox": {"l": 129.66666666666666, "t": 534.6666666666666, "r": 156.33333333333334, "b": 541.6666666666666, "coord_origin": "1"}}, {"id": 298, "text": "structure", "bbox": {"l": 159.66666666666666, "t": 536.0, "r": 193.66666666666666, "b": 541.6666666666666, "coord_origin": "1"}}, {"id": 299, "text": "is", "bbox": {"l": 197.33333333333334, "t": 534.6666666666666, "r": 203.33333333333334, "b": 541.3333333333334, "coord_origin": "1"}}, {"id": 300, "text": "non-strict.", "bbox": {"l": 206.66666666666666, "t": 534.6666666666666, "r": 246.0, "b": 541.6666666666666, "coord_origin": "1"}}, {"id": 301, "text": "The", "bbox": {"l": 250.66666666666666, "t": 534.6666666666666, "r": 265.6666666666667, "b": 541.6666666666666, "coord_origin": "1"}}, {"id": 302, "text": "gen-", "bbox": {"l": 268.6666666666667, "t": 536.6666666666666, "r": 286.0, "b": 543.6666666666666, "coord_origin": "1"}}, {"id": 303, "text": "eration", "bbox": {"l": 50.333333333333336, "t": 546.6666666666666, "r": 77.33333333333333, "b": 553.6666666666666, "coord_origin": "1"}}, {"id": 304, "text": "of", "bbox": {"l": 80.33333333333333, "t": 546.6666666666666, "r": 89.0, "b": 553.3333333333334, "coord_origin": "1"}}, {"id": 305, "text": "missing", "bbox": {"l": 91.33333333333333, "t": 546.6666666666666, "r": 121.66666666666667, "b": 555.6666666666666, "coord_origin": "1"}}, {"id": 306, "text": "bounding", "bbox": {"l": 125.0, "t": 546.6666666666666, "r": 162.0, "b": 555.6666666666666, "coord_origin": "1"}}, {"id": 307, "text": "boxes", "bbox": {"l": 165.0, "t": 546.6666666666666, "r": 187.33333333333334, "b": 553.6666666666666, "coord_origin": "1"}}, {"id": 308, "text": "for", "bbox": {"l": 190.66666666666666, "t": 546.6666666666666, "r": 202.0, "b": 553.3333333333334, "coord_origin": "1"}}, {"id": 309, "text": "non-strict", "bbox": {"l": 204.66666666666666, "t": 546.6666666666666, "r": 242.33333333333334, "b": 553.6666666666666, "coord_origin": "1"}}, {"id": 310, "text": "HTML", "bbox": {"l": 245.33333333333334, "t": 546.6666666666666, "r": 273.0, "b": 553.3333333333334, "coord_origin": "1"}}, {"id": 311, "text": "ta-", "bbox": {"l": 276.0, "t": 547.6666666666666, "r": 286.0, "b": 553.6666666666666, "coord_origin": "1"}}, {"id": 312, "text": "bles", "bbox": {"l": 50.333333333333336, "t": 558.6666666666666, "r": 65.66666666666667, "b": 565.6666666666666, "coord_origin": "1"}}, {"id": 313, "text": "is", "bbox": {"l": 70.0, "t": 558.6666666666666, "r": 76.0, "b": 565.3333333333334, "coord_origin": "1"}}, {"id": 314, "text": "ambiguous", "bbox": {"l": 80.0, "t": 558.6666666666666, "r": 123.33333333333333, "b": 567.6666666666666, "coord_origin": "1"}}, {"id": 315, "text": "and", "bbox": {"l": 127.66666666666667, "t": 558.6666666666666, "r": 141.33333333333334, "b": 565.6666666666666, "coord_origin": "1"}}, {"id": 316, "text": "therefore", "bbox": {"l": 145.66666666666666, "t": 558.6666666666666, "r": 181.0, "b": 565.6666666666666, "coord_origin": "1"}}, {"id": 317, "text": "quite", "bbox": {"l": 185.0, "t": 558.6666666666666, "r": 204.33333333333334, "b": 567.6666666666666, "coord_origin": "1"}}, {"id": 318, "text": "challenging.", "bbox": {"l": 208.66666666666666, "t": 558.6666666666666, "r": 256.6666666666667, "b": 567.6666666666666, "coord_origin": "1"}}, {"id": 319, "text": "Thus,", "bbox": {"l": 264.0, "t": 558.6666666666666, "r": 285.6666666666667, "b": 566.6666666666666, "coord_origin": "1"}}, {"id": 320, "text": "we", "bbox": {"l": 50.333333333333336, "t": 572.6666666666666, "r": 61.333333333333336, "b": 577.6666666666666, "coord_origin": "1"}}, {"id": 321, "text": "have", "bbox": {"l": 65.0, "t": 570.6666666666666, "r": 82.66666666666667, "b": 577.6666666666666, "coord_origin": "1"}}, {"id": 322, "text": "decided", "bbox": {"l": 86.33333333333333, "t": 570.6666666666666, "r": 116.66666666666667, "b": 577.6666666666666, "coord_origin": "1"}}, {"id": 323, "text": "to", "bbox": {"l": 120.33333333333333, "t": 572.0, "r": 127.66666666666667, "b": 577.6666666666666, "coord_origin": "1"}}, {"id": 324, "text": "simply", "bbox": {"l": 131.0, "t": 570.6666666666666, "r": 157.33333333333334, "b": 579.6666666666666, "coord_origin": "1"}}, {"id": 325, "text": "discard", "bbox": {"l": 161.0, "t": 570.6666666666666, "r": 189.33333333333334, "b": 577.6666666666666, "coord_origin": "1"}}, {"id": 326, "text": "those", "bbox": {"l": 192.66666666666666, "t": 570.6666666666666, "r": 213.0, "b": 577.6666666666666, "coord_origin": "1"}}, {"id": 327, "text": "tables.", "bbox": {"l": 216.66666666666666, "t": 570.6666666666666, "r": 241.66666666666666, "b": 577.6666666666666, "coord_origin": "1"}}, {"id": 328, "text": "In", "bbox": {"l": 247.0, "t": 570.6666666666666, "r": 254.66666666666666, "b": 577.3333333333334, "coord_origin": "1"}}, {"id": 329, "text": "case", "bbox": {"l": 258.0, "t": 572.6666666666666, "r": 274.6666666666667, "b": 577.6666666666666, "coord_origin": "1"}}, {"id": 330, "text": "of", "bbox": {"l": 278.3333333333333, "t": 570.6666666666666, "r": 286.6666666666667, "b": 577.3333333333334, "coord_origin": "1"}}, {"id": 331, "text": "PubTabNet", "bbox": {"l": 50.333333333333336, "t": 582.6666666666666, "r": 94.33333333333333, "b": 589.6666666666666, "coord_origin": "1"}}, {"id": 332, "text": "we", "bbox": {"l": 97.66666666666667, "t": 584.6666666666666, "r": 108.66666666666667, "b": 589.6666666666666, "coord_origin": "1"}}, {"id": 333, "text": "have", "bbox": {"l": 112.0, "t": 582.6666666666666, "r": 129.66666666666666, "b": 589.6666666666666, "coord_origin": "1"}}, {"id": 334, "text": "computed", "bbox": {"l": 133.0, "t": 582.6666666666666, "r": 171.66666666666666, "b": 591.6666666666666, "coord_origin": "1"}}, {"id": 335, "text": "missing", "bbox": {"l": 175.33333333333334, "t": 582.6666666666666, "r": 205.66666666666666, "b": 591.6666666666666, "coord_origin": "1"}}, {"id": 336, "text": "bounding", "bbox": {"l": 209.0, "t": 582.6666666666666, "r": 245.66666666666666, "b": 591.6666666666666, "coord_origin": "1"}}, {"id": 337, "text": "boxes", "bbox": {"l": 249.33333333333334, "t": 582.6666666666666, "r": 271.6666666666667, "b": 589.6666666666666, "coord_origin": "1"}}, {"id": 338, "text": "for", "bbox": {"l": 275.3333333333333, "t": 582.6666666666666, "r": 286.3333333333333, "b": 589.3333333333334, "coord_origin": "1"}}, {"id": 339, "text": "48%", "bbox": {"l": 50.0, "t": 594.0, "r": 67.66666666666667, "b": 601.0, "coord_origin": "1"}}, {"id": 340, "text": "of", "bbox": {"l": 71.0, "t": 594.0, "r": 79.66666666666667, "b": 601.0, "coord_origin": "1"}}, {"id": 341, "text": "the", "bbox": {"l": 82.0, "t": 594.0, "r": 93.33333333333333, "b": 601.0, "coord_origin": "1"}}, {"id": 342, "text": "simple", "bbox": {"l": 96.66666666666667, "t": 594.0, "r": 122.66666666666667, "b": 603.3333333333334, "coord_origin": "1"}}, {"id": 343, "text": "and", "bbox": {"l": 125.66666666666667, "t": 594.0, "r": 139.33333333333334, "b": 601.0, "coord_origin": "1"}}, {"id": 344, "text": "69%", "bbox": {"l": 142.66666666666666, "t": 594.3333333333334, "r": 160.33333333333334, "b": 601.0, "coord_origin": "1"}}, {"id": 345, "text": "of", "bbox": {"l": 163.33333333333334, "t": 594.0, "r": 172.0, "b": 601.0, "coord_origin": "1"}}, {"id": 346, "text": "the", "bbox": {"l": 174.33333333333334, "t": 594.0, "r": 185.66666666666666, "b": 601.0, "coord_origin": "1"}}, {"id": 347, "text": "complex", "bbox": {"l": 189.0, "t": 594.0, "r": 222.33333333333334, "b": 603.3333333333334, "coord_origin": "1"}}, {"id": 348, "text": "tables.", "bbox": {"l": 225.66666666666666, "t": 594.0, "r": 250.33333333333334, "b": 601.0, "coord_origin": "1"}}, {"id": 349, "text": "Regard-", "bbox": {"l": 254.66666666666666, "t": 594.0, "r": 286.0, "b": 603.3333333333334, "coord_origin": "1"}}, {"id": 350, "text": "ing", "bbox": {"l": 50.333333333333336, "t": 606.0, "r": 62.666666666666664, "b": 615.3333333333334, "coord_origin": "1"}}, {"id": 351, "text": "FinTabNet,", "bbox": {"l": 65.66666666666667, "t": 606.0, "r": 109.66666666666667, "b": 614.0, "coord_origin": "1"}}, {"id": 352, "text": "68%", "bbox": {"l": 113.33333333333333, "t": 606.0, "r": 130.66666666666666, "b": 613.0, "coord_origin": "1"}}, {"id": 353, "text": "of", "bbox": {"l": 134.0, "t": 606.0, "r": 142.66666666666666, "b": 613.0, "coord_origin": "1"}}, {"id": 354, "text": "the", "bbox": {"l": 145.0, "t": 606.0, "r": 156.33333333333334, "b": 613.0, "coord_origin": "1"}}, {"id": 355, "text": "simple", "bbox": {"l": 159.66666666666666, "t": 606.0, "r": 185.66666666666666, "b": 615.3333333333334, "coord_origin": "1"}}, {"id": 356, "text": "and", "bbox": {"l": 189.0, "t": 606.0, "r": 202.66666666666666, "b": 613.0, "coord_origin": "1"}}, {"id": 357, "text": "98%", "bbox": {"l": 205.66666666666666, "t": 606.0, "r": 223.33333333333334, "b": 613.0, "coord_origin": "1"}}, {"id": 358, "text": "of", "bbox": {"l": 226.66666666666666, "t": 606.0, "r": 235.33333333333334, "b": 613.0, "coord_origin": "1"}}, {"id": 359, "text": "the", "bbox": {"l": 237.66666666666666, "t": 606.0, "r": 249.33333333333334, "b": 613.0, "coord_origin": "1"}}, {"id": 360, "text": "complex", "bbox": {"l": 252.33333333333334, "t": 606.0, "r": 285.6666666666667, "b": 615.3333333333334, "coord_origin": "1"}}, {"id": 361, "text": "tables", "bbox": {"l": 50.333333333333336, "t": 618.0, "r": 73.0, "b": 625.0, "coord_origin": "1"}}, {"id": 362, "text": "require", "bbox": {"l": 76.0, "t": 618.0, "r": 103.66666666666667, "b": 627.3333333333334, "coord_origin": "1"}}, {"id": 363, "text": "the", "bbox": {"l": 106.66666666666667, "t": 618.0, "r": 118.33333333333333, "b": 625.0, "coord_origin": "1"}}, {"id": 364, "text": "generation", "bbox": {"l": 121.33333333333333, "t": 618.0, "r": 163.0, "b": 627.3333333333334, "coord_origin": "1"}}, {"id": 365, "text": "of", "bbox": {"l": 166.0, "t": 618.0, "r": 174.33333333333334, "b": 625.0, "coord_origin": "1"}}, {"id": 366, "text": "bounding", "bbox": {"l": 176.66666666666666, "t": 618.0, "r": 214.0, "b": 627.3333333333334, "coord_origin": "1"}}, {"id": 367, "text": "boxes.", "bbox": {"l": 217.0, "t": 618.0, "r": 241.66666666666666, "b": 625.0, "coord_origin": "1"}}]}, "text": "We have developed a technique that tries to derive a missing bounding box out of its neighbors. As a first step, we use the annotation data to generate the most fine-grained grid that covers the table structure. In case of strict HTML tables, all grid squares are associated with some table cell and in the presence of table spans a cell extends across multiple grid squares. When enough bounding boxes are known for a rectangular table, it is possible to compute the geometrical border lines between the grid rows and columns. Eventually this information is used to generate the missing bounding boxes. Additionally, the existence of unused grid squares indicates that the table rows have unequal number of columns and the overall structure is non-strict. The generation of missing bounding boxes for non-strict HTML tables is ambiguous and therefore quite challenging. Thus, we have decided to simply discard those tables. In case of PubTabNet we have computed missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes."}, {"label": "Text", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "Text", "bbox": {"l": 49.99413299560547, "t": 629.9431762695312, "r": 286.0, "b": 651.344970703125, "coord_origin": "1"}, "confidence": 0.9655510187149048, "cells": [{"id": 368, "text": "Figure", "bbox": {"l": 62.333333333333336, "t": 630.6666666666666, "r": 87.66666666666667, "b": 639.6666666666666, "coord_origin": "1"}}, {"id": 369, "text": "7", "bbox": {"l": 91.66666666666667, "t": 630.6666666666666, "r": 96.0, "b": 637.3333333333334, "coord_origin": "1"}}, {"id": 370, "text": "illustrates", "bbox": {"l": 100.33333333333333, "t": 630.6666666666666, "r": 138.33333333333334, "b": 637.6666666666666, "coord_origin": "1"}}, {"id": 371, "text": "the", "bbox": {"l": 142.66666666666666, "t": 630.6666666666666, "r": 154.0, "b": 637.6666666666666, "coord_origin": "1"}}, {"id": 372, "text": "distribution", "bbox": {"l": 158.0, "t": 630.6666666666666, "r": 203.33333333333334, "b": 637.6666666666666, "coord_origin": "1"}}, {"id": 373, "text": "of", "bbox": {"l": 207.33333333333334, "t": 630.6666666666666, "r": 216.0, "b": 637.3333333333334, "coord_origin": "1"}}, {"id": 374, "text": "the", "bbox": {"l": 219.33333333333334, "t": 630.6666666666666, "r": 230.66666666666666, "b": 637.6666666666666, "coord_origin": "1"}}, {"id": 375, "text": "tables", "bbox": {"l": 235.0, "t": 630.6666666666666, "r": 257.6666666666667, "b": 637.6666666666666, "coord_origin": "1"}}, {"id": 376, "text": "across", "bbox": {"l": 261.6666666666667, "t": 632.6666666666666, "r": 286.0, "b": 637.6666666666666, "coord_origin": "1"}}, {"id": 377, "text": "different", "bbox": {"l": 50.333333333333336, "t": 642.0, "r": 83.66666666666667, "b": 649.0, "coord_origin": "1"}}, {"id": 378, "text": "dimensions", "bbox": {"l": 86.66666666666667, "t": 642.0, "r": 131.66666666666666, "b": 649.0, "coord_origin": "1"}}, {"id": 379, "text": "per", "bbox": {"l": 134.66666666666666, "t": 644.3333333333334, "r": 147.33333333333334, "b": 651.3333333333334, "coord_origin": "1"}}, {"id": 380, "text": "dataset.", "bbox": {"l": 149.66666666666666, "t": 642.0, "r": 179.0, "b": 649.0, "coord_origin": "1"}}]}, "text": "Figure 7 illustrates the distribution of the tables across different dimensions per dataset."}, {"label": "Section-header", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "Section-header", "bbox": {"l": 49.898033142089844, "t": 661.9161987304688, "r": 153.34835815429688, "b": 672.0421752929688, "coord_origin": "1"}, "confidence": 0.9235464930534363, "cells": [{"id": 381, "text": "1.2.", "bbox": {"l": 51.0, "t": 662.0, "r": 66.0, "b": 669.6666666666666, "coord_origin": "1"}}, {"id": 382, "text": "Synthetic", "bbox": {"l": 69.66666666666667, "t": 662.0, "r": 113.0, "b": 672.0, "coord_origin": "1"}}, {"id": 383, "text": "datasets", "bbox": {"l": 116.0, "t": 662.0, "r": 153.33333333333334, "b": 669.6666666666666, "coord_origin": "1"}}]}, "text": "1.2. Synthetic datasets"}, {"label": "Text", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "Text", "bbox": {"l": 49.784549713134766, "t": 680.5510864257812, "r": 286.6666666666667, "b": 714.0, "coord_origin": "1"}, "confidence": 0.9784752130508423, "cells": [{"id": 384, "text": "Aiming", "bbox": {"l": 62.333333333333336, "t": 681.0, "r": 92.0, "b": 690.0, "coord_origin": "1"}}, {"id": 385, "text": "to", "bbox": {"l": 96.66666666666667, "t": 682.3333333333334, "r": 104.0, "b": 688.0, "coord_origin": "1"}}, {"id": 386, "text": "train", "bbox": {"l": 108.66666666666667, "t": 681.0, "r": 126.33333333333333, "b": 688.0, "coord_origin": "1"}}, {"id": 387, "text": "and", "bbox": {"l": 130.66666666666666, "t": 681.0, "r": 144.66666666666666, "b": 688.0, "coord_origin": "1"}}, {"id": 388, "text": "evaluate", "bbox": {"l": 149.0, "t": 681.0, "r": 181.0, "b": 688.0, "coord_origin": "1"}}, {"id": 389, "text": "our", "bbox": {"l": 185.66666666666666, "t": 683.0, "r": 199.0, "b": 688.0, "coord_origin": "1"}}, {"id": 390, "text": "models", "bbox": {"l": 203.33333333333334, "t": 681.0, "r": 231.33333333333334, "b": 688.0, "coord_origin": "1"}}, {"id": 391, "text": "in", "bbox": {"l": 236.0, "t": 681.0, "r": 243.0, "b": 688.0, "coord_origin": "1"}}, {"id": 392, "text": "a", "bbox": {"l": 247.66666666666666, "t": 683.0, "r": 251.66666666666666, "b": 688.0, "coord_origin": "1"}}, {"id": 393, "text": "broader", "bbox": {"l": 256.0, "t": 681.0, "r": 286.3333333333333, "b": 688.0, "coord_origin": "1"}}, {"id": 394, "text": "spectrum", "bbox": {"l": 50.333333333333336, "t": 694.3333333333334, "r": 86.33333333333333, "b": 702.0, "coord_origin": "1"}}, {"id": 395, "text": "of", "bbox": {"l": 90.33333333333333, "t": 693.0, "r": 99.0, "b": 700.0, "coord_origin": "1"}}, {"id": 396, "text": "table", "bbox": {"l": 102.66666666666667, "t": 693.0, "r": 121.0, "b": 700.0, "coord_origin": "1"}}, {"id": 397, "text": "data", "bbox": {"l": 125.33333333333333, "t": 693.0, "r": 141.66666666666666, "b": 700.0, "coord_origin": "1"}}, {"id": 398, "text": "we", "bbox": {"l": 146.0, "t": 695.0, "r": 156.66666666666666, "b": 700.0, "coord_origin": "1"}}, {"id": 399, "text": "have", "bbox": {"l": 161.0, "t": 693.0, "r": 179.0, "b": 700.0, "coord_origin": "1"}}, {"id": 400, "text": "synthesized", "bbox": {"l": 183.33333333333334, "t": 693.0, "r": 229.0, "b": 702.0, "coord_origin": "1"}}, {"id": 401, "text": "four", "bbox": {"l": 233.33333333333334, "t": 693.0, "r": 249.66666666666666, "b": 700.0, "coord_origin": "1"}}, {"id": 402, "text": "types", "bbox": {"l": 253.66666666666666, "t": 694.3333333333334, "r": 274.0, "b": 702.0, "coord_origin": "1"}}, {"id": 403, "text": "of", "bbox": {"l": 278.3333333333333, "t": 693.0, "r": 286.6666666666667, "b": 700.0, "coord_origin": "1"}}, {"id": 404, "text": "datasets.", "bbox": {"l": 50.333333333333336, "t": 705.0, "r": 83.33333333333333, "b": 712.0, "coord_origin": "1"}}, {"id": 405, "text": "Each", "bbox": {"l": 91.66666666666667, "t": 705.0, "r": 110.66666666666667, "b": 712.0, "coord_origin": "1"}}, {"id": 406, "text": "one", "bbox": {"l": 115.0, "t": 707.0, "r": 129.0, "b": 712.0, "coord_origin": "1"}}, {"id": 407, "text": "contains", "bbox": {"l": 133.33333333333334, "t": 705.0, "r": 166.0, "b": 712.0, "coord_origin": "1"}}, {"id": 408, "text": "tables", "bbox": {"l": 170.33333333333334, "t": 705.0, "r": 193.0, "b": 712.0, "coord_origin": "1"}}, {"id": 409, "text": "with", "bbox": {"l": 197.66666666666666, "t": 705.0, "r": 214.66666666666666, "b": 712.0, "coord_origin": "1"}}, {"id": 410, "text": "different", "bbox": {"l": 219.0, "t": 705.0, "r": 252.66666666666666, "b": 712.0, "coord_origin": "1"}}, {"id": 411, "text": "appear-", "bbox": {"l": 257.0, "t": 707.0, "r": 286.0, "b": 714.0, "coord_origin": "1"}}]}, "text": "Aiming to train and evaluate our models in a broader spectrum of table data we have synthesized four types of datasets. Each one contains tables with different appear-"}, {"label": "Text", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "Text", "bbox": {"l": 308.32464599609375, "t": 161.7657012939453, "r": 545.0006713867188, "b": 207.03915405273438, "coord_origin": "1"}, "confidence": 0.9791127443313599, "cells": [{"id": 412, "text": "ances", "bbox": {"l": 309.0, "t": 164.0, "r": 330.6666666666667, "b": 169.0, "coord_origin": "1"}}, {"id": 413, "text": "in", "bbox": {"l": 335.0, "t": 162.0, "r": 342.0, "b": 169.0, "coord_origin": "1"}}, {"id": 414, "text": "regard", "bbox": {"l": 346.6666666666667, "t": 162.0, "r": 371.0, "b": 171.0, "coord_origin": "1"}}, {"id": 415, "text": "to", "bbox": {"l": 375.6666666666667, "t": 163.33333333333337, "r": 383.0, "b": 169.0, "coord_origin": "1"}}, {"id": 416, "text": "their", "bbox": {"l": 387.3333333333333, "t": 162.0, "r": 405.0, "b": 169.0, "coord_origin": "1"}}, {"id": 417, "text": "size,", "bbox": {"l": 409.3333333333333, "t": 162.0, "r": 426.3333333333333, "b": 169.66666666666663, "coord_origin": "1"}}, {"id": 418, "text": "structure,", "bbox": {"l": 431.3333333333333, "t": 163.33333333333337, "r": 468.0, "b": 169.66666666666663, "coord_origin": "1"}}, {"id": 419, "text": "style", "bbox": {"l": 472.6666666666667, "t": 162.0, "r": 491.0, "b": 171.0, "coord_origin": "1"}}, {"id": 420, "text": "and", "bbox": {"l": 495.3333333333333, "t": 162.0, "r": 509.0, "b": 169.0, "coord_origin": "1"}}, {"id": 421, "text": "content.", "bbox": {"l": 513.3333333333334, "t": 163.33333333333337, "r": 544.3333333333334, "b": 169.0, "coord_origin": "1"}}, {"id": 422, "text": "Every", "bbox": {"l": 309.0, "t": 174.0, "r": 332.0, "b": 183.0, "coord_origin": "1"}}, {"id": 423, "text": "synthetic", "bbox": {"l": 336.0, "t": 174.0, "r": 371.0, "b": 183.0, "coord_origin": "1"}}, {"id": 424, "text": "dataset", "bbox": {"l": 374.6666666666667, "t": 174.0, "r": 402.0, "b": 181.0, "coord_origin": "1"}}, {"id": 425, "text": "contains", "bbox": {"l": 405.6666666666667, "t": 174.0, "r": 438.3333333333333, "b": 181.0, "coord_origin": "1"}}, {"id": 426, "text": "150k", "bbox": {"l": 443.3333333333333, "t": 174.0, "r": 461.3333333333333, "b": 181.0, "coord_origin": "1"}}, {"id": 427, "text": "examples,", "bbox": {"l": 465.0, "t": 174.0, "r": 504.0, "b": 183.0, "coord_origin": "1"}}, {"id": 428, "text": "summing", "bbox": {"l": 508.3333333333333, "t": 174.0, "r": 544.6666666666666, "b": 183.0, "coord_origin": "1"}}, {"id": 429, "text": "up", "bbox": {"l": 309.0, "t": 188.0, "r": 318.6666666666667, "b": 195.0, "coord_origin": "1"}}, {"id": 430, "text": "to", "bbox": {"l": 321.3333333333333, "t": 187.33333333333337, "r": 328.3333333333333, "b": 193.0, "coord_origin": "1"}}, {"id": 431, "text": "600k", "bbox": {"l": 331.3333333333333, "t": 186.0, "r": 350.6666666666667, "b": 193.0, "coord_origin": "1"}}, {"id": 432, "text": "synthetic", "bbox": {"l": 353.6666666666667, "t": 186.0, "r": 388.6666666666667, "b": 195.0, "coord_origin": "1"}}, {"id": 433, "text": "examples.", "bbox": {"l": 391.6666666666667, "t": 186.0, "r": 430.6666666666667, "b": 195.0, "coord_origin": "1"}}, {"id": 434, "text": "All", "bbox": {"l": 434.6666666666667, "t": 186.0, "r": 446.6666666666667, "b": 193.0, "coord_origin": "1"}}, {"id": 435, "text": "datasets", "bbox": {"l": 449.6666666666667, "t": 186.0, "r": 480.6666666666667, "b": 193.0, "coord_origin": "1"}}, {"id": 436, "text": "are", "bbox": {"l": 483.3333333333333, "t": 188.0, "r": 495.0, "b": 193.0, "coord_origin": "1"}}, {"id": 437, "text": "divided", "bbox": {"l": 497.6666666666667, "t": 186.0, "r": 527.0, "b": 193.0, "coord_origin": "1"}}, {"id": 438, "text": "into", "bbox": {"l": 530.0, "t": 186.0, "r": 545.0, "b": 193.0, "coord_origin": "1"}}, {"id": 439, "text": "Train,", "bbox": {"l": 309.0, "t": 198.0, "r": 332.0, "b": 205.66666666666663, "coord_origin": "1"}}, {"id": 440, "text": "Test", "bbox": {"l": 335.0, "t": 198.0, "r": 351.3333333333333, "b": 205.0, "coord_origin": "1"}}, {"id": 441, "text": "and", "bbox": {"l": 354.3333333333333, "t": 198.0, "r": 368.0, "b": 205.0, "coord_origin": "1"}}, {"id": 442, "text": "Val", "bbox": {"l": 371.0, "t": 198.0, "r": 383.6666666666667, "b": 205.0, "coord_origin": "1"}}, {"id": 443, "text": "splits", "bbox": {"l": 387.0, "t": 198.0, "r": 407.3333333333333, "b": 207.0, "coord_origin": "1"}}, {"id": 444, "text": "(80%,", "bbox": {"l": 410.3333333333333, "t": 198.0, "r": 433.6666666666667, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 445, "text": "10%,", "bbox": {"l": 438.0, "t": 198.0, "r": 457.0, "b": 205.66666666666663, "coord_origin": "1"}}, {"id": 446, "text": "10%).", "bbox": {"l": 461.3333333333333, "t": 198.0, "r": 483.3333333333333, "b": 206.33333333333337, "coord_origin": "1"}}]}, "text": "ances in regard to their size, structure, style and content. Every synthetic dataset contains 150k examples, summing up to 600k synthetic examples. All datasets are divided into Train, Test and Val splits (80%, 10%, 10%)."}, {"label": "Text", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "Text", "bbox": {"l": 308.44775390625, "t": 210.41331481933594, "r": 544.8419799804688, "b": 232.35369873046875, "coord_origin": "1"}, "confidence": 0.9645320773124695, "cells": [{"id": 447, "text": "The", "bbox": {"l": 321.0, "t": 211.0, "r": 336.0, "b": 218.0, "coord_origin": "1"}}, {"id": 448, "text": "process", "bbox": {"l": 339.3333333333333, "t": 213.0, "r": 368.6666666666667, "b": 220.0, "coord_origin": "1"}}, {"id": 449, "text": "of", "bbox": {"l": 372.0, "t": 211.0, "r": 380.3333333333333, "b": 218.0, "coord_origin": "1"}}, {"id": 450, "text": "generating", "bbox": {"l": 382.6666666666667, "t": 211.0, "r": 424.3333333333333, "b": 220.0, "coord_origin": "1"}}, {"id": 451, "text": "a", "bbox": {"l": 427.6666666666667, "t": 213.0, "r": 431.6666666666667, "b": 218.0, "coord_origin": "1"}}, {"id": 452, "text": "synthetic", "bbox": {"l": 435.0, "t": 211.0, "r": 470.0, "b": 220.0, "coord_origin": "1"}}, {"id": 453, "text": "dataset", "bbox": {"l": 473.3333333333333, "t": 211.0, "r": 500.6666666666667, "b": 218.0, "coord_origin": "1"}}, {"id": 454, "text": "can", "bbox": {"l": 504.0, "t": 213.0, "r": 517.0, "b": 218.0, "coord_origin": "1"}}, {"id": 455, "text": "be", "bbox": {"l": 520.6666666666666, "t": 211.0, "r": 529.0, "b": 218.0, "coord_origin": "1"}}, {"id": 456, "text": "de-", "bbox": {"l": 532.6666666666666, "t": 211.0, "r": 544.6666666666666, "b": 218.0, "coord_origin": "1"}}, {"id": 457, "text": "composed", "bbox": {"l": 309.0, "t": 223.0, "r": 348.6666666666667, "b": 232.0, "coord_origin": "1"}}, {"id": 458, "text": "into", "bbox": {"l": 352.0, "t": 223.0, "r": 367.0, "b": 230.0, "coord_origin": "1"}}, {"id": 459, "text": "the", "bbox": {"l": 370.0, "t": 223.0, "r": 381.3333333333333, "b": 230.0, "coord_origin": "1"}}, {"id": 460, "text": "following", "bbox": {"l": 384.6666666666667, "t": 223.0, "r": 422.3333333333333, "b": 232.0, "coord_origin": "1"}}, {"id": 461, "text": "steps:", "bbox": {"l": 425.6666666666667, "t": 224.33333333333337, "r": 447.0, "b": 232.0, "coord_origin": "1"}}]}, "text": "The process of generating a synthetic dataset can be decomposed into the following steps:"}, {"label": "Text", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "Text", "bbox": {"l": 308.4111022949219, "t": 235.2310333251953, "r": 545.0, "b": 316.1220397949219, "coord_origin": "1"}, "confidence": 0.9858567714691162, "cells": [{"id": 462, "text": "1.", "bbox": {"l": 322.3333333333333, "t": 235.66666666666663, "r": 327.3333333333333, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 463, "text": "Prepare", "bbox": {"l": 335.6666666666667, "t": 235.33333333333337, "r": 365.3333333333333, "b": 244.66666666666663, "coord_origin": "1"}}, {"id": 464, "text": "styling", "bbox": {"l": 370.0, "t": 235.33333333333337, "r": 396.3333333333333, "b": 244.66666666666663, "coord_origin": "1"}}, {"id": 465, "text": "and", "bbox": {"l": 400.6666666666667, "t": 235.33333333333337, "r": 414.6666666666667, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 466, "text": "content", "bbox": {"l": 419.0, "t": 236.66666666666663, "r": 447.6666666666667, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 467, "text": "templates:", "bbox": {"l": 452.3333333333333, "t": 235.33333333333337, "r": 492.0, "b": 244.66666666666663, "coord_origin": "1"}}, {"id": 468, "text": "The", "bbox": {"l": 498.6666666666667, "t": 235.33333333333337, "r": 513.6666666666666, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 469, "text": "styling", "bbox": {"l": 518.3333333333334, "t": 235.33333333333337, "r": 544.6666666666666, "b": 244.66666666666663, "coord_origin": "1"}}, {"id": 470, "text": "templates", "bbox": {"l": 309.0, "t": 247.33333333333337, "r": 346.6666666666667, "b": 256.66666666666674, "coord_origin": "1"}}, {"id": 471, "text": "have", "bbox": {"l": 350.0, "t": 247.33333333333337, "r": 368.0, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 472, "text": "been", "bbox": {"l": 371.3333333333333, "t": 247.33333333333337, "r": 389.3333333333333, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 473, "text": "manually", "bbox": {"l": 393.0, "t": 247.33333333333337, "r": 429.3333333333333, "b": 256.66666666666674, "coord_origin": "1"}}, {"id": 474, "text": "designed", "bbox": {"l": 432.3333333333333, "t": 247.33333333333337, "r": 467.3333333333333, "b": 256.66666666666674, "coord_origin": "1"}}, {"id": 475, "text": "and", "bbox": {"l": 471.0, "t": 247.33333333333337, "r": 484.6666666666667, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 476, "text": "organized", "bbox": {"l": 488.0, "t": 247.33333333333337, "r": 526.3333333333334, "b": 256.66666666666674, "coord_origin": "1"}}, {"id": 477, "text": "into", "bbox": {"l": 530.0, "t": 247.33333333333337, "r": 545.0, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 478, "text": "groups", "bbox": {"l": 309.0, "t": 261.66666666666674, "r": 335.6666666666667, "b": 268.66666666666674, "coord_origin": "1"}}, {"id": 479, "text": "of", "bbox": {"l": 339.6666666666667, "t": 259.33333333333326, "r": 348.3333333333333, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 480, "text": "scope", "bbox": {"l": 351.6666666666667, "t": 261.66666666666674, "r": 373.6666666666667, "b": 268.66666666666674, "coord_origin": "1"}}, {"id": 481, "text": "specific", "bbox": {"l": 378.0, "t": 259.33333333333326, "r": 407.6666666666667, "b": 268.66666666666674, "coord_origin": "1"}}, {"id": 482, "text": "appearances", "bbox": {"l": 412.0, "t": 261.66666666666674, "r": 460.0, "b": 268.66666666666674, "coord_origin": "1"}}, {"id": 483, "text": "(e.g.", "bbox": {"l": 464.3333333333333, "t": 260.0, "r": 481.0, "b": 268.66666666666674, "coord_origin": "1"}}, {"id": 484, "text": "financial", "bbox": {"l": 488.6666666666667, "t": 259.33333333333326, "r": 522.0, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 485, "text": "data,", "bbox": {"l": 526.0, "t": 259.33333333333326, "r": 544.3333333333334, "b": 267.0, "coord_origin": "1"}}, {"id": 486, "text": "marketing", "bbox": {"l": 309.0, "t": 271.33333333333326, "r": 349.0, "b": 280.6666666666667, "coord_origin": "1"}}, {"id": 487, "text": "data,", "bbox": {"l": 353.0, "t": 271.33333333333326, "r": 371.3333333333333, "b": 279.33333333333326, "coord_origin": "1"}}, {"id": 488, "text": "etc.)", "bbox": {"l": 376.0, "t": 271.66666666666674, "r": 393.0, "b": 279.66666666666674, "coord_origin": "1"}}, {"id": 489, "text": "Additionally,", "bbox": {"l": 400.3333333333333, "t": 271.33333333333326, "r": 451.6666666666667, "b": 280.6666666666667, "coord_origin": "1"}}, {"id": 490, "text": "we", "bbox": {"l": 456.6666666666667, "t": 273.66666666666674, "r": 467.6666666666667, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 491, "text": "have", "bbox": {"l": 472.0, "t": 271.33333333333326, "r": 489.6666666666667, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 492, "text": "prepared", "bbox": {"l": 494.0, "t": 271.33333333333326, "r": 528.3333333333334, "b": 280.6666666666667, "coord_origin": "1"}}, {"id": 493, "text": "cu-", "bbox": {"l": 532.3333333333334, "t": 273.66666666666674, "r": 544.6666666666666, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 494, "text": "rated", "bbox": {"l": 309.0, "t": 283.3333333333333, "r": 328.3333333333333, "b": 290.3333333333333, "coord_origin": "1"}}, {"id": 495, "text": "collections", "bbox": {"l": 331.0, "t": 283.3333333333333, "r": 373.6666666666667, "b": 290.3333333333333, "coord_origin": "1"}}, {"id": 496, "text": "of", "bbox": {"l": 376.3333333333333, "t": 283.3333333333333, "r": 384.6666666666667, "b": 290.3333333333333, "coord_origin": "1"}}, {"id": 497, "text": "content", "bbox": {"l": 386.3333333333333, "t": 284.6666666666667, "r": 415.3333333333333, "b": 290.3333333333333, "coord_origin": "1"}}, {"id": 498, "text": "templates", "bbox": {"l": 418.0, "t": 283.3333333333333, "r": 455.6666666666667, "b": 292.6666666666667, "coord_origin": "1"}}, {"id": 499, "text": "by", "bbox": {"l": 458.0, "t": 283.3333333333333, "r": 467.3333333333333, "b": 292.6666666666667, "coord_origin": "1"}}, {"id": 500, "text": "extracting", "bbox": {"l": 470.0, "t": 283.3333333333333, "r": 509.3333333333333, "b": 292.6666666666667, "coord_origin": "1"}}, {"id": 501, "text": "the", "bbox": {"l": 511.6666666666667, "t": 283.3333333333333, "r": 523.3333333333334, "b": 290.3333333333333, "coord_origin": "1"}}, {"id": 502, "text": "most", "bbox": {"l": 526.0, "t": 284.6666666666667, "r": 544.6666666666666, "b": 290.3333333333333, "coord_origin": "1"}}, {"id": 503, "text": "frequently", "bbox": {"l": 309.3333333333333, "t": 295.3333333333333, "r": 349.3333333333333, "b": 304.6666666666667, "coord_origin": "1"}}, {"id": 504, "text": "used", "bbox": {"l": 354.6666666666667, "t": 295.3333333333333, "r": 372.0, "b": 302.3333333333333, "coord_origin": "1"}}, {"id": 505, "text": "terms", "bbox": {"l": 377.0, "t": 296.6666666666667, "r": 398.3333333333333, "b": 302.3333333333333, "coord_origin": "1"}}, {"id": 506, "text": "out", "bbox": {"l": 403.3333333333333, "t": 296.6666666666667, "r": 415.6666666666667, "b": 302.3333333333333, "coord_origin": "1"}}, {"id": 507, "text": "of", "bbox": {"l": 420.3333333333333, "t": 295.3333333333333, "r": 429.0, "b": 302.3333333333333, "coord_origin": "1"}}, {"id": 508, "text": "non-synthetic", "bbox": {"l": 433.0, "t": 295.3333333333333, "r": 486.6666666666667, "b": 304.6666666666667, "coord_origin": "1"}}, {"id": 509, "text": "datasets", "bbox": {"l": 491.6666666666667, "t": 295.3333333333333, "r": 522.6666666666666, "b": 302.3333333333333, "coord_origin": "1"}}, {"id": 510, "text": "(e.g.", "bbox": {"l": 527.6666666666666, "t": 295.6666666666667, "r": 544.3333333333334, "b": 304.6666666666667, "coord_origin": "1"}}, {"id": 511, "text": "PubTabNet,", "bbox": {"l": 309.0, "t": 307.0, "r": 355.3333333333333, "b": 314.6666666666667, "coord_origin": "1"}}, {"id": 512, "text": "FinTabNet,", "bbox": {"l": 358.6666666666667, "t": 307.0, "r": 402.6666666666667, "b": 314.6666666666667, "coord_origin": "1"}}, {"id": 513, "text": "etc.).", "bbox": {"l": 406.0, "t": 307.6666666666667, "r": 425.0, "b": 315.3333333333333, "coord_origin": "1"}}]}, "text": "1. Prepare styling and content templates: The styling templates have been manually designed and organized into groups of scope specific appearances (e.g. financial data, marketing data, etc.) Additionally, we have prepared curated collections of content templates by extracting the most frequently used terms out of non-synthetic datasets (e.g. PubTabNet, FinTabNet, etc.)."}, {"label": "Text", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "Text", "bbox": {"l": 308.2052001953125, "t": 319.20440673828125, "r": 545.3333333333334, "b": 448.723388671875, "coord_origin": "1"}, "confidence": 0.9882545471191406, "cells": [{"id": 514, "text": "2.", "bbox": {"l": 321.0, "t": 320.0, "r": 327.3333333333333, "b": 327.0, "coord_origin": "1"}}, {"id": 515, "text": "Generate", "bbox": {"l": 333.0, "t": 320.0, "r": 368.3333333333333, "b": 327.0, "coord_origin": "1"}}, {"id": 516, "text": "table", "bbox": {"l": 372.0, "t": 320.0, "r": 390.6666666666667, "b": 327.0, "coord_origin": "1"}}, {"id": 517, "text": "structures:", "bbox": {"l": 394.3333333333333, "t": 321.0, "r": 434.3333333333333, "b": 327.0, "coord_origin": "1"}}, {"id": 518, "text": "The", "bbox": {"l": 439.3333333333333, "t": 320.0, "r": 454.3333333333333, "b": 327.0, "coord_origin": "1"}}, {"id": 519, "text": "structure", "bbox": {"l": 458.0, "t": 321.3333333333333, "r": 492.3333333333333, "b": 327.0, "coord_origin": "1"}}, {"id": 520, "text": "of", "bbox": {"l": 495.6666666666667, "t": 320.0, "r": 504.3333333333333, "b": 327.0, "coord_origin": "1"}}, {"id": 521, "text": "each", "bbox": {"l": 507.0, "t": 320.0, "r": 524.6666666666666, "b": 327.0, "coord_origin": "1"}}, {"id": 522, "text": "syn-", "bbox": {"l": 528.3333333333334, "t": 322.0, "r": 544.6666666666666, "b": 329.0, "coord_origin": "1"}}, {"id": 523, "text": "thetic", "bbox": {"l": 309.0, "t": 332.0, "r": 330.6666666666667, "b": 339.0, "coord_origin": "1"}}, {"id": 524, "text": "dataset", "bbox": {"l": 334.3333333333333, "t": 332.0, "r": 361.3333333333333, "b": 339.0, "coord_origin": "1"}}, {"id": 525, "text": "assumes", "bbox": {"l": 365.0, "t": 334.0, "r": 397.6666666666667, "b": 339.0, "coord_origin": "1"}}, {"id": 526, "text": "a", "bbox": {"l": 401.3333333333333, "t": 334.0, "r": 405.3333333333333, "b": 339.0, "coord_origin": "1"}}, {"id": 527, "text": "horizontal", "bbox": {"l": 409.0, "t": 332.0, "r": 448.6666666666667, "b": 339.0, "coord_origin": "1"}}, {"id": 528, "text": "table", "bbox": {"l": 452.6666666666667, "t": 332.0, "r": 471.3333333333333, "b": 339.0, "coord_origin": "1"}}, {"id": 529, "text": "header", "bbox": {"l": 475.0, "t": 332.0, "r": 501.3333333333333, "b": 339.0, "coord_origin": "1"}}, {"id": 530, "text": "which", "bbox": {"l": 504.6666666666667, "t": 332.0, "r": 528.3333333333334, "b": 339.0, "coord_origin": "1"}}, {"id": 531, "text": "po-", "bbox": {"l": 532.0, "t": 334.0, "r": 544.6666666666666, "b": 341.0, "coord_origin": "1"}}, {"id": 532, "text": "tentially", "bbox": {"l": 309.0, "t": 344.0, "r": 341.0, "b": 353.0, "coord_origin": "1"}}, {"id": 533, "text": "spans", "bbox": {"l": 346.0, "t": 346.0, "r": 367.6666666666667, "b": 353.0, "coord_origin": "1"}}, {"id": 534, "text": "over", "bbox": {"l": 372.3333333333333, "t": 346.0, "r": 389.6666666666667, "b": 351.0, "coord_origin": "1"}}, {"id": 535, "text": "multiple", "bbox": {"l": 394.3333333333333, "t": 344.0, "r": 426.6666666666667, "b": 353.0, "coord_origin": "1"}}, {"id": 536, "text": "rows", "bbox": {"l": 431.6666666666667, "t": 346.0, "r": 450.3333333333333, "b": 351.0, "coord_origin": "1"}}, {"id": 537, "text": "and", "bbox": {"l": 455.0, "t": 344.0, "r": 468.6666666666667, "b": 351.0, "coord_origin": "1"}}, {"id": 538, "text": "a", "bbox": {"l": 473.6666666666667, "t": 346.0, "r": 477.6666666666667, "b": 351.0, "coord_origin": "1"}}, {"id": 539, "text": "table", "bbox": {"l": 482.6666666666667, "t": 344.0, "r": 501.3333333333333, "b": 351.0, "coord_origin": "1"}}, {"id": 540, "text": "body", "bbox": {"l": 506.3333333333333, "t": 344.0, "r": 525.3333333333334, "b": 353.0, "coord_origin": "1"}}, {"id": 541, "text": "that", "bbox": {"l": 530.6666666666666, "t": 344.0, "r": 544.6666666666666, "b": 351.0, "coord_origin": "1"}}, {"id": 542, "text": "may", "bbox": {"l": 309.0, "t": 358.0, "r": 325.6666666666667, "b": 365.0, "coord_origin": "1"}}, {"id": 543, "text": "contain", "bbox": {"l": 328.3333333333333, "t": 356.0, "r": 357.3333333333333, "b": 363.0, "coord_origin": "1"}}, {"id": 544, "text": "a", "bbox": {"l": 360.3333333333333, "t": 358.0, "r": 364.3333333333333, "b": 363.0, "coord_origin": "1"}}, {"id": 545, "text": "combination", "bbox": {"l": 367.0, "t": 356.0, "r": 416.0, "b": 363.0, "coord_origin": "1"}}, {"id": 546, "text": "of", "bbox": {"l": 419.0, "t": 356.0, "r": 427.6666666666667, "b": 363.0, "coord_origin": "1"}}, {"id": 547, "text": "row", "bbox": {"l": 429.6666666666667, "t": 358.0, "r": 444.3333333333333, "b": 363.0, "coord_origin": "1"}}, {"id": 548, "text": "spans", "bbox": {"l": 447.3333333333333, "t": 358.0, "r": 468.6666666666667, "b": 365.0, "coord_origin": "1"}}, {"id": 549, "text": "and", "bbox": {"l": 471.6666666666667, "t": 356.0, "r": 485.3333333333333, "b": 363.0, "coord_origin": "1"}}, {"id": 550, "text": "column", "bbox": {"l": 488.3333333333333, "t": 356.0, "r": 517.6666666666666, "b": 363.0, "coord_origin": "1"}}, {"id": 551, "text": "spans.", "bbox": {"l": 520.6666666666666, "t": 358.0, "r": 544.3333333333334, "b": 365.0, "coord_origin": "1"}}, {"id": 552, "text": "However,", "bbox": {"l": 309.3333333333333, "t": 368.0, "r": 346.3333333333333, "b": 375.6666666666667, "coord_origin": "1"}}, {"id": 553, "text": "spans", "bbox": {"l": 350.3333333333333, "t": 370.0, "r": 371.6666666666667, "b": 377.0, "coord_origin": "1"}}, {"id": 554, "text": "are", "bbox": {"l": 375.3333333333333, "t": 370.0, "r": 386.6666666666667, "b": 375.0, "coord_origin": "1"}}, {"id": 555, "text": "not", "bbox": {"l": 390.3333333333333, "t": 369.0, "r": 402.6666666666667, "b": 375.0, "coord_origin": "1"}}, {"id": 556, "text": "allowed", "bbox": {"l": 406.0, "t": 368.0, "r": 436.6666666666667, "b": 375.0, "coord_origin": "1"}}, {"id": 557, "text": "to", "bbox": {"l": 440.3333333333333, "t": 369.3333333333333, "r": 447.6666666666667, "b": 375.0, "coord_origin": "1"}}, {"id": 558, "text": "cross", "bbox": {"l": 451.0, "t": 370.0, "r": 471.0, "b": 375.0, "coord_origin": "1"}}, {"id": 559, "text": "the", "bbox": {"l": 474.6666666666667, "t": 368.0, "r": 486.0, "b": 375.0, "coord_origin": "1"}}, {"id": 560, "text": "header", "bbox": {"l": 489.6666666666667, "t": 368.0, "r": 516.0, "b": 375.0, "coord_origin": "1"}}, {"id": 561, "text": "-", "bbox": {"l": 519.3333333333334, "t": 372.0, "r": 521.6666666666666, "b": 373.0, "coord_origin": "1"}}, {"id": 562, "text": "body", "bbox": {"l": 525.3333333333334, "t": 368.0, "r": 544.6666666666666, "b": 377.0, "coord_origin": "1"}}, {"id": 563, "text": "boundary.", "bbox": {"l": 309.0, "t": 380.0, "r": 347.6666666666667, "b": 389.0, "coord_origin": "1"}}, {"id": 564, "text": "The", "bbox": {"l": 353.6666666666667, "t": 380.0, "r": 368.6666666666667, "b": 387.0, "coord_origin": "1"}}, {"id": 565, "text": "table", "bbox": {"l": 372.3333333333333, "t": 380.0, "r": 391.3333333333333, "b": 387.0, "coord_origin": "1"}}, {"id": 566, "text": "structure", "bbox": {"l": 395.0, "t": 381.3333333333333, "r": 429.3333333333333, "b": 387.0, "coord_origin": "1"}}, {"id": 567, "text": "is", "bbox": {"l": 433.0, "t": 380.0, "r": 439.0, "b": 387.0, "coord_origin": "1"}}, {"id": 568, "text": "described", "bbox": {"l": 442.6666666666667, "t": 380.0, "r": 480.3333333333333, "b": 387.0, "coord_origin": "1"}}, {"id": 569, "text": "by", "bbox": {"l": 484.3333333333333, "t": 380.0, "r": 493.3333333333333, "b": 389.0, "coord_origin": "1"}}, {"id": 570, "text": "the", "bbox": {"l": 497.3333333333333, "t": 380.0, "r": 509.0, "b": 387.0, "coord_origin": "1"}}, {"id": 571, "text": "parame-", "bbox": {"l": 512.6666666666666, "t": 382.0, "r": 544.6666666666666, "b": 389.0, "coord_origin": "1"}}, {"id": 572, "text": "ters:", "bbox": {"l": 309.0, "t": 392.6666666666667, "r": 325.0, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 573, "text": "Total", "bbox": {"l": 331.0, "t": 391.6666666666667, "r": 350.6666666666667, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 574, "text": "number", "bbox": {"l": 354.6666666666667, "t": 391.6666666666667, "r": 385.0, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 575, "text": "of", "bbox": {"l": 388.6666666666667, "t": 391.3333333333333, "r": 397.0, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 576, "text": "table", "bbox": {"l": 400.3333333333333, "t": 391.6666666666667, "r": 419.0, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 577, "text": "rows", "bbox": {"l": 423.0, "t": 393.6666666666667, "r": 441.6666666666667, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 578, "text": "and", "bbox": {"l": 445.6666666666667, "t": 391.3333333333333, "r": 459.3333333333333, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 579, "text": "columns,", "bbox": {"l": 463.3333333333333, "t": 391.3333333333333, "r": 498.6666666666667, "b": 399.0, "coord_origin": "1"}}, {"id": 580, "text": "number", "bbox": {"l": 503.3333333333333, "t": 391.3333333333333, "r": 533.3333333333334, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 581, "text": "of", "bbox": {"l": 537.0, "t": 391.3333333333333, "r": 545.3333333333334, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 582, "text": "header", "bbox": {"l": 309.0, "t": 403.3333333333333, "r": 335.3333333333333, "b": 410.3333333333333, "coord_origin": "1"}}, {"id": 583, "text": "rows,", "bbox": {"l": 339.3333333333333, "t": 405.6666666666667, "r": 360.3333333333333, "b": 411.3333333333333, "coord_origin": "1"}}, {"id": 584, "text": "type", "bbox": {"l": 365.3333333333333, "t": 404.6666666666667, "r": 381.6666666666667, "b": 412.6666666666667, "coord_origin": "1"}}, {"id": 585, "text": "of", "bbox": {"l": 386.3333333333333, "t": 403.3333333333333, "r": 394.6666666666667, "b": 410.3333333333333, "coord_origin": "1"}}, {"id": 586, "text": "spans", "bbox": {"l": 398.6666666666667, "t": 405.6666666666667, "r": 420.0, "b": 412.6666666666667, "coord_origin": "1"}}, {"id": 587, "text": "(header", "bbox": {"l": 424.6666666666667, "t": 403.3333333333333, "r": 454.0, "b": 411.6666666666667, "coord_origin": "1"}}, {"id": 588, "text": "only", "bbox": {"l": 458.0, "t": 403.6666666666667, "r": 475.3333333333333, "b": 412.6666666666667, "coord_origin": "1"}}, {"id": 589, "text": "spans,", "bbox": {"l": 480.0, "t": 405.6666666666667, "r": 503.6666666666667, "b": 412.6666666666667, "coord_origin": "1"}}, {"id": 590, "text": "row", "bbox": {"l": 508.3333333333333, "t": 405.6666666666667, "r": 523.0, "b": 410.3333333333333, "coord_origin": "1"}}, {"id": 591, "text": "only", "bbox": {"l": 527.6666666666666, "t": 403.6666666666667, "r": 544.6666666666666, "b": 412.6666666666667, "coord_origin": "1"}}, {"id": 592, "text": "spans,", "bbox": {"l": 309.0, "t": 417.6666666666667, "r": 333.0, "b": 424.6666666666667, "coord_origin": "1"}}, {"id": 593, "text": "column", "bbox": {"l": 338.3333333333333, "t": 415.6666666666667, "r": 367.3333333333333, "b": 422.3333333333333, "coord_origin": "1"}}, {"id": 594, "text": "only", "bbox": {"l": 372.3333333333333, "t": 415.6666666666667, "r": 389.3333333333333, "b": 424.6666666666667, "coord_origin": "1"}}, {"id": 595, "text": "spans,", "bbox": {"l": 394.3333333333333, "t": 417.6666666666667, "r": 418.0, "b": 424.6666666666667, "coord_origin": "1"}}, {"id": 596, "text": "both", "bbox": {"l": 423.6666666666667, "t": 415.6666666666667, "r": 440.6666666666667, "b": 422.3333333333333, "coord_origin": "1"}}, {"id": 597, "text": "row", "bbox": {"l": 445.3333333333333, "t": 417.6666666666667, "r": 460.0, "b": 422.3333333333333, "coord_origin": "1"}}, {"id": 598, "text": "and", "bbox": {"l": 464.6666666666667, "t": 415.6666666666667, "r": 478.3333333333333, "b": 422.3333333333333, "coord_origin": "1"}}, {"id": 599, "text": "column", "bbox": {"l": 483.3333333333333, "t": 415.6666666666667, "r": 512.6666666666666, "b": 422.3333333333333, "coord_origin": "1"}}, {"id": 600, "text": "spans),", "bbox": {"l": 517.3333333333334, "t": 415.6666666666667, "r": 544.3333333333334, "b": 424.6666666666667, "coord_origin": "1"}}, {"id": 601, "text": "maximum", "bbox": {"l": 309.0, "t": 427.3333333333333, "r": 348.6666666666667, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 602, "text": "span", "bbox": {"l": 352.6666666666667, "t": 429.6666666666667, "r": 370.0, "b": 436.6666666666667, "coord_origin": "1"}}, {"id": 603, "text": "size", "bbox": {"l": 374.0, "t": 427.3333333333333, "r": 388.6666666666667, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 604, "text": "and", "bbox": {"l": 392.0, "t": 427.6666666666667, "r": 406.0, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 605, "text": "the", "bbox": {"l": 409.6666666666667, "t": 427.6666666666667, "r": 421.0, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 606, "text": "ratio", "bbox": {"l": 424.6666666666667, "t": 427.3333333333333, "r": 442.3333333333333, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 607, "text": "of", "bbox": {"l": 445.6666666666667, "t": 427.3333333333333, "r": 454.3333333333333, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 608, "text": "the", "bbox": {"l": 457.3333333333333, "t": 427.6666666666667, "r": 468.6666666666667, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 609, "text": "table", "bbox": {"l": 472.3333333333333, "t": 427.6666666666667, "r": 491.0, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 610, "text": "area", "bbox": {"l": 494.6666666666667, "t": 429.6666666666667, "r": 510.6666666666667, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 611, "text": "covered", "bbox": {"l": 514.0, "t": 427.6666666666667, "r": 544.6666666666666, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 612, "text": "by", "bbox": {"l": 309.0, "t": 439.6666666666667, "r": 318.3333333333333, "b": 448.6666666666667, "coord_origin": "1"}}, {"id": 613, "text": "spans.", "bbox": {"l": 321.6666666666667, "t": 441.6666666666667, "r": 345.3333333333333, "b": 448.6666666666667, "coord_origin": "1"}}]}, "text": "2. Generate table structures: The structure of each synthetic dataset assumes a horizontal table header which potentially spans over multiple rows and a table body that may contain a combination of row spans and column spans. However, spans are not allowed to cross the header -body boundary. The table structure is described by the parameters: Total number of table rows and columns, number of header rows, type of spans (header only spans, row only spans, column only spans, both row and column spans), maximum span size and the ratio of the table area covered by spans."}, {"label": "Text", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "Text", "bbox": {"l": 308.17218017578125, "t": 451.7388000488281, "r": 545.3333333333334, "b": 497.0, "coord_origin": "1"}, "confidence": 0.9816291332244873, "cells": [{"id": 614, "text": "3.", "bbox": {"l": 321.0, "t": 452.3333333333333, "r": 327.3333333333333, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 615, "text": "Generate", "bbox": {"l": 331.3333333333333, "t": 452.3333333333333, "r": 366.6666666666667, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 616, "text": "content:", "bbox": {"l": 369.6666666666667, "t": 453.6666666666667, "r": 401.0, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 617, "text": "Based", "bbox": {"l": 405.0, "t": 452.3333333333333, "r": 428.6666666666667, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 618, "text": "on", "bbox": {"l": 431.3333333333333, "t": 454.6666666666667, "r": 441.0, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 619, "text": "the", "bbox": {"l": 444.0, "t": 452.3333333333333, "r": 455.3333333333333, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 620, "text": "dataset", "bbox": {"l": 458.3333333333333, "t": 452.3333333333333, "r": 485.3333333333333, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 621, "text": "theme,", "bbox": {"l": 488.3333333333333, "t": 452.3333333333333, "r": 513.6666666666666, "b": 460.3333333333333, "coord_origin": "1"}}, {"id": 622, "text": "a", "bbox": {"l": 517.0, "t": 454.6666666666667, "r": 521.0, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 623, "text": "set", "bbox": {"l": 523.6666666666666, "t": 453.6666666666667, "r": 534.0, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 624, "text": "of", "bbox": {"l": 537.0, "t": 452.3333333333333, "r": 545.3333333333334, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 625, "text": "suitable", "bbox": {"l": 309.0, "t": 464.0, "r": 339.3333333333333, "b": 471.0, "coord_origin": "1"}}, {"id": 626, "text": "content", "bbox": {"l": 342.3333333333333, "t": 465.3333333333333, "r": 371.0, "b": 471.0, "coord_origin": "1"}}, {"id": 627, "text": "templates", "bbox": {"l": 374.0, "t": 464.0, "r": 411.3333333333333, "b": 473.0, "coord_origin": "1"}}, {"id": 628, "text": "is", "bbox": {"l": 414.3333333333333, "t": 464.0, "r": 420.3333333333333, "b": 471.0, "coord_origin": "1"}}, {"id": 629, "text": "chosen", "bbox": {"l": 423.0, "t": 464.0, "r": 450.3333333333333, "b": 471.0, "coord_origin": "1"}}, {"id": 630, "text": "first.", "bbox": {"l": 453.3333333333333, "t": 464.0, "r": 470.0, "b": 471.0, "coord_origin": "1"}}, {"id": 631, "text": "Then,", "bbox": {"l": 474.0, "t": 464.0, "r": 496.3333333333333, "b": 471.6666666666667, "coord_origin": "1"}}, {"id": 632, "text": "this", "bbox": {"l": 499.3333333333333, "t": 464.0, "r": 513.3333333333334, "b": 471.0, "coord_origin": "1"}}, {"id": 633, "text": "content", "bbox": {"l": 516.0, "t": 465.3333333333333, "r": 544.6666666666666, "b": 471.0, "coord_origin": "1"}}, {"id": 634, "text": "can", "bbox": {"l": 309.0, "t": 478.0, "r": 322.3333333333333, "b": 483.0, "coord_origin": "1"}}, {"id": 635, "text": "be", "bbox": {"l": 326.6666666666667, "t": 476.0, "r": 335.3333333333333, "b": 483.0, "coord_origin": "1"}}, {"id": 636, "text": "combined", "bbox": {"l": 339.6666666666667, "t": 476.0, "r": 378.3333333333333, "b": 483.0, "coord_origin": "1"}}, {"id": 637, "text": "with", "bbox": {"l": 383.0, "t": 476.0, "r": 400.0, "b": 483.0, "coord_origin": "1"}}, {"id": 638, "text": "purely", "bbox": {"l": 404.0, "t": 476.0, "r": 428.6666666666667, "b": 485.0, "coord_origin": "1"}}, {"id": 639, "text": "random", "bbox": {"l": 433.3333333333333, "t": 476.0, "r": 463.0, "b": 483.0, "coord_origin": "1"}}, {"id": 640, "text": "text", "bbox": {"l": 467.3333333333333, "t": 477.3333333333333, "r": 481.6666666666667, "b": 483.0, "coord_origin": "1"}}, {"id": 641, "text": "to", "bbox": {"l": 486.0, "t": 477.3333333333333, "r": 493.0, "b": 483.0, "coord_origin": "1"}}, {"id": 642, "text": "produce", "bbox": {"l": 497.3333333333333, "t": 476.0, "r": 528.6666666666666, "b": 485.0, "coord_origin": "1"}}, {"id": 643, "text": "the", "bbox": {"l": 533.3333333333334, "t": 476.0, "r": 544.6666666666666, "b": 483.0, "coord_origin": "1"}}, {"id": 644, "text": "synthetic", "bbox": {"l": 309.0, "t": 488.0, "r": 344.3333333333333, "b": 497.0, "coord_origin": "1"}}, {"id": 645, "text": "content.", "bbox": {"l": 347.3333333333333, "t": 489.0, "r": 378.3333333333333, "b": 495.0, "coord_origin": "1"}}]}, "text": "3. Generate content: Based on the dataset theme, a set of suitable content templates is chosen first. Then, this content can be combined with purely random text to produce the synthetic content."}, {"label": "Text", "id": 13, "page_no": 0, "cluster": {"id": 13, "label": "Text", "bbox": {"l": 308.402587890625, "t": 500.48095703125, "r": 545.0632934570312, "b": 545.6666666666666, "coord_origin": "1"}, "confidence": 0.9804794788360596, "cells": [{"id": 646, "text": "4.", "bbox": {"l": 320.6666666666667, "t": 501.0, "r": 327.3333333333333, "b": 508.0, "coord_origin": "1"}}, {"id": 647, "text": "Apply", "bbox": {"l": 334.3333333333333, "t": 501.0, "r": 358.6666666666667, "b": 510.0, "coord_origin": "1"}}, {"id": 648, "text": "styling", "bbox": {"l": 363.0, "t": 501.0, "r": 389.3333333333333, "b": 510.0, "coord_origin": "1"}}, {"id": 649, "text": "templates:", "bbox": {"l": 393.3333333333333, "t": 501.0, "r": 433.3333333333333, "b": 510.0, "coord_origin": "1"}}, {"id": 650, "text": "Depending", "bbox": {"l": 439.3333333333333, "t": 501.0, "r": 482.3333333333333, "b": 510.0, "coord_origin": "1"}}, {"id": 651, "text": "on", "bbox": {"l": 486.3333333333333, "t": 503.0, "r": 495.6666666666667, "b": 508.0, "coord_origin": "1"}}, {"id": 652, "text": "the", "bbox": {"l": 500.0, "t": 501.0, "r": 511.3333333333333, "b": 508.0, "coord_origin": "1"}}, {"id": 653, "text": "domain", "bbox": {"l": 515.3333333333334, "t": 501.0, "r": 544.6666666666666, "b": 508.0, "coord_origin": "1"}}, {"id": 654, "text": "of", "bbox": {"l": 309.0, "t": 513.0, "r": 317.6666666666667, "b": 520.0, "coord_origin": "1"}}, {"id": 655, "text": "the", "bbox": {"l": 321.3333333333333, "t": 513.0, "r": 332.6666666666667, "b": 520.0, "coord_origin": "1"}}, {"id": 656, "text": "synthetic", "bbox": {"l": 337.3333333333333, "t": 513.0, "r": 372.3333333333333, "b": 522.0, "coord_origin": "1"}}, {"id": 657, "text": "dataset,", "bbox": {"l": 376.6666666666667, "t": 513.0, "r": 406.3333333333333, "b": 520.6666666666666, "coord_origin": "1"}}, {"id": 658, "text": "a", "bbox": {"l": 411.3333333333333, "t": 515.0, "r": 415.3333333333333, "b": 520.0, "coord_origin": "1"}}, {"id": 659, "text": "set", "bbox": {"l": 419.6666666666667, "t": 514.0, "r": 430.0, "b": 520.0, "coord_origin": "1"}}, {"id": 660, "text": "of", "bbox": {"l": 434.3333333333333, "t": 513.0, "r": 443.0, "b": 520.0, "coord_origin": "1"}}, {"id": 661, "text": "styling", "bbox": {"l": 446.6666666666667, "t": 513.0, "r": 473.0, "b": 522.0, "coord_origin": "1"}}, {"id": 662, "text": "templates", "bbox": {"l": 477.3333333333333, "t": 513.0, "r": 515.0, "b": 522.0, "coord_origin": "1"}}, {"id": 663, "text": "is", "bbox": {"l": 519.6666666666666, "t": 513.0, "r": 525.3333333333334, "b": 520.0, "coord_origin": "1"}}, {"id": 664, "text": "first", "bbox": {"l": 530.0, "t": 513.0, "r": 544.6666666666666, "b": 520.0, "coord_origin": "1"}}, {"id": 665, "text": "manually", "bbox": {"l": 309.0, "t": 525.0, "r": 345.3333333333333, "b": 534.0, "coord_origin": "1"}}, {"id": 666, "text": "selected.", "bbox": {"l": 350.0, "t": 525.0, "r": 383.6666666666667, "b": 532.0, "coord_origin": "1"}}, {"id": 667, "text": "Then,", "bbox": {"l": 391.3333333333333, "t": 525.0, "r": 413.6666666666667, "b": 532.6666666666666, "coord_origin": "1"}}, {"id": 668, "text": "a", "bbox": {"l": 418.3333333333333, "t": 527.0, "r": 422.3333333333333, "b": 532.0, "coord_origin": "1"}}, {"id": 669, "text": "style", "bbox": {"l": 427.0, "t": 525.0, "r": 445.0, "b": 534.0, "coord_origin": "1"}}, {"id": 670, "text": "is", "bbox": {"l": 449.3333333333333, "t": 525.0, "r": 455.3333333333333, "b": 532.0, "coord_origin": "1"}}, {"id": 671, "text": "randomly", "bbox": {"l": 459.6666666666667, "t": 525.0, "r": 497.3333333333333, "b": 534.0, "coord_origin": "1"}}, {"id": 672, "text": "selected", "bbox": {"l": 502.0, "t": 525.0, "r": 533.3333333333334, "b": 532.0, "coord_origin": "1"}}, {"id": 673, "text": "to", "bbox": {"l": 537.6666666666666, "t": 526.0, "r": 545.0, "b": 532.0, "coord_origin": "1"}}, {"id": 674, "text": "format", "bbox": {"l": 309.3333333333333, "t": 536.3333333333334, "r": 335.0, "b": 543.3333333333334, "coord_origin": "1"}}, {"id": 675, "text": "the", "bbox": {"l": 338.0, "t": 536.3333333333334, "r": 349.6666666666667, "b": 543.3333333333334, "coord_origin": "1"}}, {"id": 676, "text": "appearance", "bbox": {"l": 352.6666666666667, "t": 538.6666666666666, "r": 397.0, "b": 545.6666666666666, "coord_origin": "1"}}, {"id": 677, "text": "of", "bbox": {"l": 400.0, "t": 536.3333333333334, "r": 408.6666666666667, "b": 543.3333333333334, "coord_origin": "1"}}, {"id": 678, "text": "the", "bbox": {"l": 411.0, "t": 536.6666666666666, "r": 422.3333333333333, "b": 543.3333333333334, "coord_origin": "1"}}, {"id": 679, "text": "synthesized", "bbox": {"l": 425.6666666666667, "t": 536.3333333333334, "r": 471.3333333333333, "b": 545.6666666666666, "coord_origin": "1"}}, {"id": 680, "text": "table.", "bbox": {"l": 474.6666666666667, "t": 536.3333333333334, "r": 495.3333333333333, "b": 543.3333333333334, "coord_origin": "1"}}]}, "text": "4. Apply styling templates: Depending on the domain of the synthetic dataset, a set of styling templates is first manually selected. Then, a style is randomly selected to format the appearance of the synthesized table."}, {"label": "Text", "id": 14, "page_no": 0, "cluster": {"id": 14, "label": "Text", "bbox": {"l": 308.32305908203125, "t": 548.5647583007812, "r": 545.078857421875, "b": 606.7564697265625, "coord_origin": "1"}, "confidence": 0.9807284474372864, "cells": [{"id": 681, "text": "5.", "bbox": {"l": 321.0, "t": 549.3333333333334, "r": 327.3333333333333, "b": 556.3333333333334, "coord_origin": "1"}}, {"id": 682, "text": "Render", "bbox": {"l": 335.6666666666667, "t": 549.3333333333334, "r": 364.3333333333333, "b": 556.3333333333334, "coord_origin": "1"}}, {"id": 683, "text": "the", "bbox": {"l": 368.3333333333333, "t": 549.3333333333334, "r": 379.6666666666667, "b": 556.3333333333334, "coord_origin": "1"}}, {"id": 684, "text": "complete", "bbox": {"l": 384.0, "t": 549.3333333333334, "r": 420.0, "b": 558.6666666666666, "coord_origin": "1"}}, {"id": 685, "text": "tables:", "bbox": {"l": 424.6666666666667, "t": 549.3333333333334, "r": 449.6666666666667, "b": 556.3333333333334, "coord_origin": "1"}}, {"id": 686, "text": "The", "bbox": {"l": 456.3333333333333, "t": 549.3333333333334, "r": 471.3333333333333, "b": 556.3333333333334, "coord_origin": "1"}}, {"id": 687, "text": "synthetic", "bbox": {"l": 475.6666666666667, "t": 549.3333333333334, "r": 511.0, "b": 558.3333333333334, "coord_origin": "1"}}, {"id": 688, "text": "table", "bbox": {"l": 515.3333333333334, "t": 549.3333333333334, "r": 534.3333333333334, "b": 556.3333333333334, "coord_origin": "1"}}, {"id": 689, "text": "is", "bbox": {"l": 538.6666666666666, "t": 549.3333333333334, "r": 544.6666666666666, "b": 556.3333333333334, "coord_origin": "1"}}, {"id": 690, "text": "finally", "bbox": {"l": 309.3333333333333, "t": 561.3333333333334, "r": 333.6666666666667, "b": 570.6666666666666, "coord_origin": "1"}}, {"id": 691, "text": "rendered", "bbox": {"l": 338.0, "t": 561.3333333333334, "r": 372.3333333333333, "b": 568.3333333333334, "coord_origin": "1"}}, {"id": 692, "text": "by", "bbox": {"l": 376.6666666666667, "t": 561.3333333333334, "r": 386.0, "b": 570.6666666666666, "coord_origin": "1"}}, {"id": 693, "text": "a", "bbox": {"l": 390.3333333333333, "t": 563.6666666666666, "r": 394.3333333333333, "b": 568.3333333333334, "coord_origin": "1"}}, {"id": 694, "text": "web", "bbox": {"l": 398.6666666666667, "t": 561.3333333333334, "r": 414.3333333333333, "b": 568.3333333333334, "coord_origin": "1"}}, {"id": 695, "text": "browser", "bbox": {"l": 418.6666666666667, "t": 561.3333333333334, "r": 450.3333333333333, "b": 568.3333333333334, "coord_origin": "1"}}, {"id": 696, "text": "engine", "bbox": {"l": 454.0, "t": 561.3333333333334, "r": 480.0, "b": 570.6666666666666, "coord_origin": "1"}}, {"id": 697, "text": "to", "bbox": {"l": 484.3333333333333, "t": 562.6666666666666, "r": 491.6666666666667, "b": 568.3333333333334, "coord_origin": "1"}}, {"id": 698, "text": "generate", "bbox": {"l": 495.6666666666667, "t": 562.6666666666666, "r": 529.0, "b": 570.6666666666666, "coord_origin": "1"}}, {"id": 699, "text": "the", "bbox": {"l": 533.3333333333334, "t": 561.3333333333334, "r": 544.6666666666666, "b": 568.3333333333334, "coord_origin": "1"}}, {"id": 700, "text": "bounding", "bbox": {"l": 309.0, "t": 573.3333333333334, "r": 346.0, "b": 582.6666666666666, "coord_origin": "1"}}, {"id": 701, "text": "boxes", "bbox": {"l": 349.0, "t": 573.3333333333334, "r": 371.6666666666667, "b": 580.3333333333334, "coord_origin": "1"}}, {"id": 702, "text": "for", "bbox": {"l": 375.0, "t": 573.3333333333334, "r": 386.0, "b": 580.3333333333334, "coord_origin": "1"}}, {"id": 703, "text": "each", "bbox": {"l": 388.6666666666667, "t": 573.3333333333334, "r": 406.3333333333333, "b": 580.3333333333334, "coord_origin": "1"}}, {"id": 704, "text": "table", "bbox": {"l": 409.3333333333333, "t": 573.3333333333334, "r": 428.0, "b": 580.3333333333334, "coord_origin": "1"}}, {"id": 705, "text": "cell.", "bbox": {"l": 431.0, "t": 573.3333333333334, "r": 447.0, "b": 580.3333333333334, "coord_origin": "1"}}, {"id": 706, "text": "A", "bbox": {"l": 451.3333333333333, "t": 573.6666666666666, "r": 457.6666666666667, "b": 580.3333333333334, "coord_origin": "1"}}, {"id": 707, "text": "batching", "bbox": {"l": 460.6666666666667, "t": 573.3333333333334, "r": 494.6666666666667, "b": 582.6666666666666, "coord_origin": "1"}}, {"id": 708, "text": "technique", "bbox": {"l": 497.6666666666667, "t": 573.3333333333334, "r": 535.6666666666666, "b": 582.6666666666666, "coord_origin": "1"}}, {"id": 709, "text": "is", "bbox": {"l": 538.6666666666666, "t": 573.3333333333334, "r": 544.6666666666666, "b": 580.3333333333334, "coord_origin": "1"}}, {"id": 710, "text": "utilized", "bbox": {"l": 309.0, "t": 585.3333333333334, "r": 338.3333333333333, "b": 592.3333333333334, "coord_origin": "1"}}, {"id": 711, "text": "to", "bbox": {"l": 342.3333333333333, "t": 586.6666666666666, "r": 349.3333333333333, "b": 592.3333333333334, "coord_origin": "1"}}, {"id": 712, "text": "optimize", "bbox": {"l": 353.3333333333333, "t": 585.3333333333334, "r": 387.3333333333333, "b": 594.6666666666666, "coord_origin": "1"}}, {"id": 713, "text": "the", "bbox": {"l": 391.3333333333333, "t": 585.3333333333334, "r": 402.6666666666667, "b": 592.3333333333334, "coord_origin": "1"}}, {"id": 714, "text": "runtime", "bbox": {"l": 406.6666666666667, "t": 585.3333333333334, "r": 437.0, "b": 592.3333333333334, "coord_origin": "1"}}, {"id": 715, "text": "overhead", "bbox": {"l": 440.6666666666667, "t": 585.3333333333334, "r": 476.3333333333333, "b": 592.3333333333334, "coord_origin": "1"}}, {"id": 716, "text": "of", "bbox": {"l": 480.3333333333333, "t": 585.3333333333334, "r": 488.6666666666667, "b": 592.3333333333334, "coord_origin": "1"}}, {"id": 717, "text": "the", "bbox": {"l": 492.0, "t": 585.3333333333334, "r": 503.3333333333333, "b": 592.3333333333334, "coord_origin": "1"}}, {"id": 718, "text": "rendering", "bbox": {"l": 507.0, "t": 585.3333333333334, "r": 544.6666666666666, "b": 594.6666666666666, "coord_origin": "1"}}, {"id": 719, "text": "process.", "bbox": {"l": 309.0, "t": 599.6666666666666, "r": 340.3333333333333, "b": 606.6666666666666, "coord_origin": "1"}}]}, "text": "5. Render the complete tables: The synthetic table is finally rendered by a web browser engine to generate the bounding boxes for each table cell. A batching technique is utilized to optimize the runtime overhead of the rendering process."}, {"label": "Section-header", "id": 15, "page_no": 0, "cluster": {"id": 15, "label": "Section-header", "bbox": {"l": 308.37005615234375, "t": 621.5151977539062, "r": 544.79541015625, "b": 646.3232421875, "coord_origin": "1"}, "confidence": 0.9583657383918762, "cells": [{"id": 720, "text": "2.", "bbox": {"l": 309.0, "t": 622.0, "r": 317.3333333333333, "b": 630.3333333333334, "coord_origin": "1"}}, {"id": 721, "text": "Prediction", "bbox": {"l": 323.6666666666667, "t": 622.0, "r": 376.3333333333333, "b": 630.3333333333334, "coord_origin": "1"}}, {"id": 722, "text": "post-processing", "bbox": {"l": 382.6666666666667, "t": 622.0, "r": 461.0, "b": 632.6666666666666, "coord_origin": "1"}}, {"id": 723, "text": "for", "bbox": {"l": 467.0, "t": 622.0, "r": 481.6666666666667, "b": 630.3333333333334, "coord_origin": "1"}}, {"id": 724, "text": "PDF", "bbox": {"l": 487.6666666666667, "t": 622.0, "r": 510.3333333333333, "b": 630.3333333333334, "coord_origin": "1"}}, {"id": 725, "text": "docu-", "bbox": {"l": 516.6666666666666, "t": 622.0, "r": 544.6666666666666, "b": 630.3333333333334, "coord_origin": "1"}}, {"id": 726, "text": "ments", "bbox": {"l": 327.0, "t": 636.6666666666666, "r": 357.0, "b": 644.3333333333334, "coord_origin": "1"}}]}, "text": "2. Prediction post-processing for PDF documents"}, {"label": "Text", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "Text", "bbox": {"l": 308.54010009765625, "t": 656.3193359375, "r": 544.7320556640625, "b": 714.0350341796875, "coord_origin": "1"}, "confidence": 0.9851495027542114, "cells": [{"id": 727, "text": "Although", "bbox": {"l": 321.0, "t": 657.0, "r": 358.0, "b": 666.0, "coord_origin": "1"}}, {"id": 728, "text": "TableFormer", "bbox": {"l": 360.3333333333333, "t": 657.0, "r": 411.3333333333333, "b": 664.0, "coord_origin": "1"}}, {"id": 729, "text": "can", "bbox": {"l": 413.3333333333333, "t": 659.0, "r": 426.6666666666667, "b": 664.0, "coord_origin": "1"}}, {"id": 730, "text": "predict", "bbox": {"l": 429.3333333333333, "t": 657.0, "r": 456.3333333333333, "b": 666.0, "coord_origin": "1"}}, {"id": 731, "text": "the", "bbox": {"l": 459.0, "t": 657.0, "r": 470.3333333333333, "b": 664.0, "coord_origin": "1"}}, {"id": 732, "text": "table", "bbox": {"l": 473.0, "t": 657.0, "r": 491.6666666666667, "b": 664.0, "coord_origin": "1"}}, {"id": 733, "text": "structure", "bbox": {"l": 494.3333333333333, "t": 658.3333333333334, "r": 528.3333333333334, "b": 664.0, "coord_origin": "1"}}, {"id": 734, "text": "and", "bbox": {"l": 531.0, "t": 657.0, "r": 544.6666666666666, "b": 664.0, "coord_origin": "1"}}, {"id": 735, "text": "the", "bbox": {"l": 309.0, "t": 669.0, "r": 320.6666666666667, "b": 676.0, "coord_origin": "1"}}, {"id": 736, "text": "bounding", "bbox": {"l": 323.6666666666667, "t": 669.0, "r": 361.0, "b": 678.0, "coord_origin": "1"}}, {"id": 737, "text": "boxes", "bbox": {"l": 364.0, "t": 669.0, "r": 386.3333333333333, "b": 676.0, "coord_origin": "1"}}, {"id": 738, "text": "for", "bbox": {"l": 389.6666666666667, "t": 669.0, "r": 401.0, "b": 676.0, "coord_origin": "1"}}, {"id": 739, "text": "tables", "bbox": {"l": 403.6666666666667, "t": 669.0, "r": 426.3333333333333, "b": 676.0, "coord_origin": "1"}}, {"id": 740, "text": "recognized", "bbox": {"l": 429.3333333333333, "t": 669.0, "r": 472.3333333333333, "b": 678.0, "coord_origin": "1"}}, {"id": 741, "text": "inside", "bbox": {"l": 475.6666666666667, "t": 669.0, "r": 498.6666666666667, "b": 676.0, "coord_origin": "1"}}, {"id": 742, "text": "PDF", "bbox": {"l": 502.0, "t": 669.0, "r": 520.0, "b": 676.0, "coord_origin": "1"}}, {"id": 743, "text": "docu-", "bbox": {"l": 522.6666666666666, "t": 669.0, "r": 544.6666666666666, "b": 676.0, "coord_origin": "1"}}, {"id": 744, "text": "ments,", "bbox": {"l": 309.0, "t": 682.3333333333334, "r": 334.6666666666667, "b": 688.6666666666666, "coord_origin": "1"}}, {"id": 745, "text": "this", "bbox": {"l": 338.6666666666667, "t": 681.0, "r": 352.3333333333333, "b": 688.0, "coord_origin": "1"}}, {"id": 746, "text": "is", "bbox": {"l": 356.0, "t": 681.0, "r": 361.6666666666667, "b": 688.0, "coord_origin": "1"}}, {"id": 747, "text": "not", "bbox": {"l": 365.3333333333333, "t": 682.3333333333334, "r": 377.3333333333333, "b": 688.0, "coord_origin": "1"}}, {"id": 748, "text": "enough", "bbox": {"l": 381.0, "t": 681.0, "r": 409.6666666666667, "b": 690.0, "coord_origin": "1"}}, {"id": 749, "text": "when", "bbox": {"l": 413.3333333333333, "t": 681.0, "r": 434.3333333333333, "b": 688.0, "coord_origin": "1"}}, {"id": 750, "text": "a", "bbox": {"l": 434.6666666666667, "t": 679.6666666666666, "r": 438.6666666666667, "b": 691.6666666666666, "coord_origin": "1"}}, {"id": 751, "text": "full", "bbox": {"l": 445.3333333333333, "t": 681.0, "r": 458.3333333333333, "b": 688.0, "coord_origin": "1"}}, {"id": 752, "text": "reconstruction", "bbox": {"l": 462.0, "t": 681.0, "r": 518.3333333333334, "b": 688.0, "coord_origin": "1"}}, {"id": 753, "text": "of", "bbox": {"l": 521.6666666666666, "t": 681.0, "r": 530.3333333333334, "b": 688.0, "coord_origin": "1"}}, {"id": 754, "text": "the", "bbox": {"l": 533.3333333333334, "t": 681.0, "r": 544.6666666666666, "b": 688.0, "coord_origin": "1"}}, {"id": 755, "text": "original", "bbox": {"l": 309.0, "t": 693.0, "r": 339.3333333333333, "b": 702.0, "coord_origin": "1"}}, {"id": 756, "text": "table", "bbox": {"l": 342.6666666666667, "t": 693.0, "r": 361.3333333333333, "b": 700.0, "coord_origin": "1"}}, {"id": 757, "text": "is", "bbox": {"l": 365.0, "t": 693.0, "r": 370.6666666666667, "b": 700.0, "coord_origin": "1"}}, {"id": 758, "text": "required.", "bbox": {"l": 374.0, "t": 693.0, "r": 408.6666666666667, "b": 702.0, "coord_origin": "1"}}, {"id": 759, "text": "This", "bbox": {"l": 413.0, "t": 693.0, "r": 430.3333333333333, "b": 700.0, "coord_origin": "1"}}, {"id": 760, "text": "happens", "bbox": {"l": 433.6666666666667, "t": 693.0, "r": 465.6666666666667, "b": 702.0, "coord_origin": "1"}}, {"id": 761, "text": "mainly", "bbox": {"l": 469.0, "t": 693.0, "r": 495.6666666666667, "b": 702.0, "coord_origin": "1"}}, {"id": 762, "text": "due", "bbox": {"l": 499.0, "t": 693.0, "r": 512.6666666666666, "b": 700.0, "coord_origin": "1"}}, {"id": 763, "text": "the", "bbox": {"l": 516.3333333333334, "t": 693.0, "r": 527.6666666666666, "b": 700.0, "coord_origin": "1"}}, {"id": 764, "text": "fol-", "bbox": {"l": 531.0, "t": 693.0, "r": 544.6666666666666, "b": 700.0, "coord_origin": "1"}}, {"id": 765, "text": "lowing", "bbox": {"l": 309.3333333333333, "t": 705.0, "r": 336.0, "b": 714.0, "coord_origin": "1"}}, {"id": 766, "text": "reasons:", "bbox": {"l": 339.0, "t": 707.0, "r": 370.6666666666667, "b": 712.0, "coord_origin": "1"}}]}, "text": "Although TableFormer can predict the table structure and the bounding boxes for tables recognized inside PDF documents, this is not enough when a full reconstruction of the original table is required. This happens mainly due the following reasons:"}], "body": [{"label": "Section-header", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "Section-header", "bbox": {"l": 132.81927490234375, "t": 109.81901550292969, "r": 465.6957702636719, "b": 135.33333333333337, "coord_origin": "1"}, "confidence": 0.6151334643363953, "cells": [{"id": 0, "text": "TableFormer:", "bbox": {"l": 133.0, "t": 110.0, "r": 203.0, "b": 118.66666666666663, "coord_origin": "1"}}, {"id": 1, "text": "Table", "bbox": {"l": 207.66666666666666, "t": 110.0, "r": 235.33333333333334, "b": 118.66666666666663, "coord_origin": "1"}}, {"id": 2, "text": "Structure", "bbox": {"l": 239.0, "t": 110.0, "r": 287.3333333333333, "b": 118.66666666666663, "coord_origin": "1"}}, {"id": 3, "text": "Understanding", "bbox": {"l": 290.6666666666667, "t": 110.0, "r": 366.6666666666667, "b": 121.0, "coord_origin": "1"}}, {"id": 4, "text": "with", "bbox": {"l": 370.3333333333333, "t": 110.0, "r": 392.3333333333333, "b": 118.66666666666663, "coord_origin": "1"}}, {"id": 5, "text": "Transformers", "bbox": {"l": 395.6666666666667, "t": 110.0, "r": 465.0, "b": 118.66666666666663, "coord_origin": "1"}}, {"id": 6, "text": "Supplementary", "bbox": {"l": 220.66666666666666, "t": 121.66666666666663, "r": 315.6666666666667, "b": 135.33333333333337, "coord_origin": "1"}}, {"id": 7, "text": "Material", "bbox": {"l": 321.6666666666667, "t": 121.66666666666663, "r": 374.6666666666667, "b": 132.33333333333337, "coord_origin": "1"}}]}, "text": "TableFormer: Table Structure Understanding with Transformers Supplementary Material"}, {"label": "Section-header", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "Section-header", "bbox": {"l": 49.808494567871094, "t": 160.33333333333337, "r": 175.76251220703125, "b": 171.59271240234375, "coord_origin": "1"}, "confidence": 0.9245885610580444, "cells": [{"id": 8, "text": "1.", "bbox": {"l": 51.0, "t": 160.66666666666663, "r": 58.666666666666664, "b": 169.0, "coord_origin": "1"}}, {"id": 9, "text": "Details", "bbox": {"l": 62.333333333333336, "t": 160.33333333333337, "r": 97.0, "b": 169.0, "coord_origin": "1"}}, {"id": 10, "text": "on", "bbox": {"l": 100.33333333333333, "t": 163.0, "r": 112.66666666666667, "b": 169.0, "coord_origin": "1"}}, {"id": 11, "text": "the", "bbox": {"l": 116.0, "t": 160.66666666666663, "r": 131.66666666666666, "b": 169.0, "coord_origin": "1"}}, {"id": 12, "text": "datasets", "bbox": {"l": 135.0, "t": 160.66666666666663, "r": 175.66666666666666, "b": 169.0, "coord_origin": "1"}}]}, "text": "1. Details on the datasets"}, {"label": "Section-header", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "Section-header", "bbox": {"l": 49.78814697265625, "t": 180.33333333333337, "r": 150.2134552001953, "b": 190.48927307128906, "coord_origin": "1"}, "confidence": 0.9166122674942017, "cells": [{"id": 13, "text": "1.1.", "bbox": {"l": 51.0, "t": 180.33333333333337, "r": 66.0, "b": 188.33333333333337, "coord_origin": "1"}}, {"id": 14, "text": "Data", "bbox": {"l": 69.66666666666667, "t": 180.33333333333337, "r": 91.33333333333333, "b": 188.33333333333337, "coord_origin": "1"}}, {"id": 15, "text": "preparation", "bbox": {"l": 94.66666666666667, "t": 180.33333333333337, "r": 150.0, "b": 190.33333333333337, "coord_origin": "1"}}]}, "text": "1.1. Data preparation"}, {"label": "Text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "Text", "bbox": {"l": 49.627410888671875, "t": 198.0, "r": 286.6666666666667, "b": 388.20391845703125, "coord_origin": "1"}, "confidence": 0.9902494549751282, "cells": [{"id": 16, "text": "As", "bbox": {"l": 62.333333333333336, "t": 199.66666666666663, "r": 72.66666666666667, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 17, "text": "a", "bbox": {"l": 74.0, "t": 198.0, "r": 78.0, "b": 210.0, "coord_origin": "1"}}, {"id": 18, "text": "first", "bbox": {"l": 84.33333333333333, "t": 199.33333333333337, "r": 99.0, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 19, "text": "step", "bbox": {"l": 102.66666666666667, "t": 200.66666666666663, "r": 118.0, "b": 208.66666666666663, "coord_origin": "1"}}, {"id": 20, "text": "of", "bbox": {"l": 121.66666666666667, "t": 199.33333333333337, "r": 130.33333333333334, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 21, "text": "our", "bbox": {"l": 133.33333333333334, "t": 201.66666666666663, "r": 146.33333333333334, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 22, "text": "data", "bbox": {"l": 149.33333333333334, "t": 199.33333333333337, "r": 165.66666666666666, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 23, "text": "preparation", "bbox": {"l": 169.33333333333334, "t": 199.33333333333337, "r": 214.0, "b": 208.66666666666663, "coord_origin": "1"}}, {"id": 24, "text": "process,", "bbox": {"l": 217.66666666666666, "t": 201.66666666666663, "r": 249.33333333333334, "b": 208.66666666666663, "coord_origin": "1"}}, {"id": 25, "text": "we", "bbox": {"l": 253.33333333333334, "t": 201.66666666666663, "r": 264.3333333333333, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 26, "text": "have", "bbox": {"l": 268.3333333333333, "t": 199.33333333333337, "r": 286.0, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 27, "text": "calculated", "bbox": {"l": 50.333333333333336, "t": 211.33333333333337, "r": 90.0, "b": 218.33333333333337, "coord_origin": "1"}}, {"id": 28, "text": "statistics", "bbox": {"l": 94.33333333333333, "t": 211.33333333333337, "r": 128.0, "b": 218.33333333333337, "coord_origin": "1"}}, {"id": 29, "text": "over", "bbox": {"l": 132.0, "t": 213.66666666666663, "r": 149.33333333333334, "b": 218.33333333333337, "coord_origin": "1"}}, {"id": 30, "text": "the", "bbox": {"l": 153.0, "t": 211.33333333333337, "r": 164.66666666666666, "b": 218.33333333333337, "coord_origin": "1"}}, {"id": 31, "text": "datasets", "bbox": {"l": 168.66666666666666, "t": 211.33333333333337, "r": 199.66666666666666, "b": 218.33333333333337, "coord_origin": "1"}}, {"id": 32, "text": "across", "bbox": {"l": 204.0, "t": 213.66666666666663, "r": 228.0, "b": 218.33333333333337, "coord_origin": "1"}}, {"id": 33, "text": "the", "bbox": {"l": 232.33333333333334, "t": 211.33333333333337, "r": 244.0, "b": 218.33333333333337, "coord_origin": "1"}}, {"id": 34, "text": "following", "bbox": {"l": 248.33333333333334, "t": 211.33333333333337, "r": 286.0, "b": 220.66666666666663, "coord_origin": "1"}}, {"id": 35, "text": "dimensions:", "bbox": {"l": 50.333333333333336, "t": 223.33333333333337, "r": 97.33333333333333, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 36, "text": "(1)", "bbox": {"l": 102.33333333333333, "t": 223.66666666666663, "r": 113.0, "b": 231.66666666666663, "coord_origin": "1"}}, {"id": 37, "text": "table", "bbox": {"l": 116.66666666666667, "t": 223.33333333333337, "r": 135.33333333333334, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 38, "text": "size", "bbox": {"l": 138.66666666666666, "t": 223.33333333333337, "r": 153.33333333333334, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 39, "text": "measured", "bbox": {"l": 157.0, "t": 223.33333333333337, "r": 194.33333333333334, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 40, "text": "in", "bbox": {"l": 198.0, "t": 223.33333333333337, "r": 205.0, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 41, "text": "the", "bbox": {"l": 208.33333333333334, "t": 223.33333333333337, "r": 220.0, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 42, "text": "number", "bbox": {"l": 223.33333333333334, "t": 223.33333333333337, "r": 253.33333333333334, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 43, "text": "of", "bbox": {"l": 256.3333333333333, "t": 223.33333333333337, "r": 265.0, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 44, "text": "rows", "bbox": {"l": 267.3333333333333, "t": 225.66666666666663, "r": 286.0, "b": 230.33333333333337, "coord_origin": "1"}}, {"id": 45, "text": "and", "bbox": {"l": 50.333333333333336, "t": 235.33333333333337, "r": 64.0, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 46, "text": "columns,", "bbox": {"l": 67.66666666666667, "t": 235.33333333333337, "r": 103.66666666666667, "b": 243.33333333333337, "coord_origin": "1"}}, {"id": 47, "text": "(2)", "bbox": {"l": 108.0, "t": 235.33333333333337, "r": 118.66666666666667, "b": 243.66666666666663, "coord_origin": "1"}}, {"id": 48, "text": "complexity", "bbox": {"l": 122.66666666666667, "t": 235.33333333333337, "r": 166.66666666666666, "b": 244.66666666666663, "coord_origin": "1"}}, {"id": 49, "text": "of", "bbox": {"l": 170.66666666666666, "t": 235.33333333333337, "r": 179.0, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 50, "text": "the", "bbox": {"l": 182.33333333333334, "t": 235.33333333333337, "r": 193.66666666666666, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 51, "text": "table,", "bbox": {"l": 197.66666666666666, "t": 235.33333333333337, "r": 218.66666666666666, "b": 243.33333333333337, "coord_origin": "1"}}, {"id": 52, "text": "(3)", "bbox": {"l": 223.0, "t": 235.33333333333337, "r": 234.0, "b": 243.66666666666663, "coord_origin": "1"}}, {"id": 53, "text": "strictness", "bbox": {"l": 238.0, "t": 235.33333333333337, "r": 274.3333333333333, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 54, "text": "of", "bbox": {"l": 278.3333333333333, "t": 235.33333333333337, "r": 286.6666666666667, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 55, "text": "the", "bbox": {"l": 50.333333333333336, "t": 247.33333333333337, "r": 62.0, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 56, "text": "provided", "bbox": {"l": 65.0, "t": 247.33333333333337, "r": 99.66666666666667, "b": 256.66666666666674, "coord_origin": "1"}}, {"id": 57, "text": "HTML", "bbox": {"l": 103.0, "t": 247.33333333333337, "r": 130.66666666666666, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 58, "text": "structure", "bbox": {"l": 133.66666666666666, "t": 248.66666666666663, "r": 167.66666666666666, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 59, "text": "and", "bbox": {"l": 170.66666666666666, "t": 247.33333333333337, "r": 184.66666666666666, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 60, "text": "(4)", "bbox": {"l": 187.66666666666666, "t": 247.33333333333337, "r": 198.66666666666666, "b": 255.66666666666663, "coord_origin": "1"}}, {"id": 61, "text": "completeness", "bbox": {"l": 201.66666666666666, "t": 247.33333333333337, "r": 255.0, "b": 256.66666666666674, "coord_origin": "1"}}, {"id": 62, "text": "(i.e.", "bbox": {"l": 258.3333333333333, "t": 247.33333333333337, "r": 272.6666666666667, "b": 255.66666666666663, "coord_origin": "1"}}, {"id": 63, "text": "no", "bbox": {"l": 276.6666666666667, "t": 249.66666666666663, "r": 286.0, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 64, "text": "omitted", "bbox": {"l": 50.333333333333336, "t": 259.33333333333326, "r": 80.0, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 65, "text": "bounding", "bbox": {"l": 82.66666666666667, "t": 259.33333333333326, "r": 120.0, "b": 268.66666666666674, "coord_origin": "1"}}, {"id": 66, "text": "boxes).", "bbox": {"l": 122.33333333333333, "t": 259.33333333333326, "r": 150.33333333333334, "b": 267.66666666666674, "coord_origin": "1"}}, {"id": 67, "text": "A", "bbox": {"l": 155.0, "t": 259.66666666666674, "r": 158.0, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 68, "text": "table", "bbox": {"l": 163.66666666666666, "t": 259.33333333333326, "r": 182.33333333333334, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 69, "text": "is", "bbox": {"l": 185.0, "t": 259.33333333333326, "r": 191.0, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 70, "text": "considered", "bbox": {"l": 193.33333333333334, "t": 259.33333333333326, "r": 236.0, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 71, "text": "to", "bbox": {"l": 239.0, "t": 260.66666666666674, "r": 246.0, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 72, "text": "be", "bbox": {"l": 248.66666666666666, "t": 259.33333333333326, "r": 257.3333333333333, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 73, "text": "simple", "bbox": {"l": 260.0, "t": 259.33333333333326, "r": 286.0, "b": 268.66666666666674, "coord_origin": "1"}}, {"id": 74, "text": "if", "bbox": {"l": 50.333333333333336, "t": 271.33333333333326, "r": 56.666666666666664, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 75, "text": "it", "bbox": {"l": 59.0, "t": 271.33333333333326, "r": 63.666666666666664, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 76, "text": "does", "bbox": {"l": 66.66666666666667, "t": 271.33333333333326, "r": 84.66666666666667, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 77, "text": "not", "bbox": {"l": 87.66666666666667, "t": 272.66666666666674, "r": 99.66666666666667, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 78, "text": "contain", "bbox": {"l": 102.66666666666667, "t": 271.33333333333326, "r": 131.66666666666666, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 79, "text": "row", "bbox": {"l": 134.66666666666666, "t": 273.66666666666674, "r": 149.33333333333334, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 80, "text": "spans", "bbox": {"l": 152.33333333333334, "t": 273.66666666666674, "r": 174.0, "b": 280.6666666666667, "coord_origin": "1"}}, {"id": 81, "text": "or", "bbox": {"l": 177.0, "t": 273.66666666666674, "r": 185.0, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 82, "text": "column", "bbox": {"l": 187.66666666666666, "t": 271.33333333333326, "r": 217.0, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 83, "text": "spans.", "bbox": {"l": 220.33333333333334, "t": 273.66666666666674, "r": 244.0, "b": 280.6666666666667, "coord_origin": "1"}}, {"id": 84, "text": "Addition-", "bbox": {"l": 248.0, "t": 271.33333333333326, "r": 286.0, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 85, "text": "ally,", "bbox": {"l": 50.333333333333336, "t": 283.0, "r": 66.33333333333333, "b": 292.0, "coord_origin": "1"}}, {"id": 86, "text": "a", "bbox": {"l": 69.33333333333333, "t": 285.0, "r": 73.33333333333333, "b": 290.0, "coord_origin": "1"}}, {"id": 87, "text": "table", "bbox": {"l": 76.0, "t": 283.0, "r": 94.66666666666667, "b": 290.0, "coord_origin": "1"}}, {"id": 88, "text": "has", "bbox": {"l": 97.66666666666667, "t": 283.0, "r": 110.33333333333333, "b": 290.0, "coord_origin": "1"}}, {"id": 89, "text": "a", "bbox": {"l": 113.0, "t": 285.0, "r": 117.0, "b": 290.0, "coord_origin": "1"}}, {"id": 90, "text": "strict", "bbox": {"l": 120.0, "t": 283.0, "r": 139.0, "b": 290.0, "coord_origin": "1"}}, {"id": 91, "text": "HTML", "bbox": {"l": 142.0, "t": 283.0, "r": 169.66666666666666, "b": 290.0, "coord_origin": "1"}}, {"id": 92, "text": "structure", "bbox": {"l": 172.33333333333334, "t": 284.3333333333333, "r": 206.33333333333334, "b": 290.0, "coord_origin": "1"}}, {"id": 93, "text": "if", "bbox": {"l": 209.33333333333334, "t": 283.0, "r": 215.66666666666666, "b": 290.0, "coord_origin": "1"}}, {"id": 94, "text": "every", "bbox": {"l": 217.33333333333334, "t": 285.0, "r": 238.66666666666666, "b": 292.0, "coord_origin": "1"}}, {"id": 95, "text": "row", "bbox": {"l": 241.33333333333334, "t": 285.0, "r": 256.0, "b": 290.0, "coord_origin": "1"}}, {"id": 96, "text": "has", "bbox": {"l": 259.0, "t": 283.0, "r": 271.6666666666667, "b": 290.0, "coord_origin": "1"}}, {"id": 97, "text": "the", "bbox": {"l": 274.3333333333333, "t": 283.0, "r": 286.0, "b": 290.0, "coord_origin": "1"}}, {"id": 98, "text": "same", "bbox": {"l": 50.333333333333336, "t": 297.0, "r": 70.0, "b": 302.0, "coord_origin": "1"}}, {"id": 99, "text": "number", "bbox": {"l": 73.66666666666667, "t": 295.0, "r": 103.66666666666667, "b": 302.0, "coord_origin": "1"}}, {"id": 100, "text": "of", "bbox": {"l": 106.66666666666667, "t": 295.0, "r": 115.33333333333333, "b": 302.0, "coord_origin": "1"}}, {"id": 101, "text": "columns", "bbox": {"l": 117.66666666666667, "t": 295.0, "r": 150.66666666666666, "b": 302.0, "coord_origin": "1"}}, {"id": 102, "text": "after", "bbox": {"l": 154.0, "t": 295.0, "r": 172.0, "b": 302.0, "coord_origin": "1"}}, {"id": 103, "text": "taking", "bbox": {"l": 175.0, "t": 295.0, "r": 199.33333333333334, "b": 304.0, "coord_origin": "1"}}, {"id": 104, "text": "into", "bbox": {"l": 202.66666666666666, "t": 295.0, "r": 217.66666666666666, "b": 302.0, "coord_origin": "1"}}, {"id": 105, "text": "account", "bbox": {"l": 220.66666666666666, "t": 296.3333333333333, "r": 251.0, "b": 302.0, "coord_origin": "1"}}, {"id": 106, "text": "any", "bbox": {"l": 254.33333333333334, "t": 297.0, "r": 268.0, "b": 304.0, "coord_origin": "1"}}, {"id": 107, "text": "row", "bbox": {"l": 271.3333333333333, "t": 297.0, "r": 286.0, "b": 302.0, "coord_origin": "1"}}, {"id": 108, "text": "or", "bbox": {"l": 50.333333333333336, "t": 309.0, "r": 58.333333333333336, "b": 314.0, "coord_origin": "1"}}, {"id": 109, "text": "column", "bbox": {"l": 61.333333333333336, "t": 307.0, "r": 90.66666666666667, "b": 314.0, "coord_origin": "1"}}, {"id": 110, "text": "spans.", "bbox": {"l": 94.66666666666667, "t": 309.0, "r": 118.0, "b": 316.0, "coord_origin": "1"}}, {"id": 111, "text": "Therefore", "bbox": {"l": 123.33333333333333, "t": 307.0, "r": 162.0, "b": 314.0, "coord_origin": "1"}}, {"id": 112, "text": "a", "bbox": {"l": 165.66666666666666, "t": 309.0, "r": 169.66666666666666, "b": 314.0, "coord_origin": "1"}}, {"id": 113, "text": "strict", "bbox": {"l": 173.33333333333334, "t": 307.0, "r": 192.33333333333334, "b": 314.0, "coord_origin": "1"}}, {"id": 114, "text": "HTML", "bbox": {"l": 196.0, "t": 307.0, "r": 223.66666666666666, "b": 314.0, "coord_origin": "1"}}, {"id": 115, "text": "structure", "bbox": {"l": 227.33333333333334, "t": 308.3333333333333, "r": 261.3333333333333, "b": 314.0, "coord_origin": "1"}}, {"id": 116, "text": "looks", "bbox": {"l": 265.0, "t": 307.0, "r": 286.0, "b": 314.0, "coord_origin": "1"}}, {"id": 117, "text": "always", "bbox": {"l": 50.333333333333336, "t": 319.0, "r": 77.33333333333333, "b": 328.0, "coord_origin": "1"}}, {"id": 118, "text": "rectangular.", "bbox": {"l": 80.66666666666667, "t": 319.0, "r": 126.33333333333333, "b": 328.0, "coord_origin": "1"}}, {"id": 119, "text": "However,", "bbox": {"l": 131.66666666666666, "t": 319.0, "r": 168.66666666666666, "b": 326.6666666666667, "coord_origin": "1"}}, {"id": 120, "text": "HTML", "bbox": {"l": 172.33333333333334, "t": 319.0, "r": 200.0, "b": 326.0, "coord_origin": "1"}}, {"id": 121, "text": "is", "bbox": {"l": 203.66666666666666, "t": 319.0, "r": 209.33333333333334, "b": 326.0, "coord_origin": "1"}}, {"id": 122, "text": "a", "bbox": {"l": 211.33333333333334, "t": 317.6666666666667, "r": 214.33333333333334, "b": 329.3333333333333, "coord_origin": "1"}}, {"id": 123, "text": "lenient", "bbox": {"l": 220.33333333333334, "t": 319.0, "r": 246.66666666666666, "b": 326.0, "coord_origin": "1"}}, {"id": 124, "text": "encoding", "bbox": {"l": 250.0, "t": 319.0, "r": 286.0, "b": 328.0, "coord_origin": "1"}}, {"id": 125, "text": "format,", "bbox": {"l": 50.666666666666664, "t": 331.0, "r": 78.66666666666667, "b": 338.6666666666667, "coord_origin": "1"}}, {"id": 126, "text": "i.e.", "bbox": {"l": 83.33333333333333, "t": 331.0, "r": 94.66666666666667, "b": 338.0, "coord_origin": "1"}}, {"id": 127, "text": "tables", "bbox": {"l": 101.66666666666667, "t": 331.0, "r": 124.33333333333333, "b": 338.0, "coord_origin": "1"}}, {"id": 128, "text": "with", "bbox": {"l": 128.66666666666666, "t": 331.0, "r": 145.66666666666666, "b": 338.0, "coord_origin": "1"}}, {"id": 129, "text": "rows", "bbox": {"l": 149.66666666666666, "t": 333.0, "r": 168.33333333333334, "b": 338.0, "coord_origin": "1"}}, {"id": 130, "text": "of", "bbox": {"l": 172.33333333333334, "t": 331.0, "r": 181.0, "b": 338.0, "coord_origin": "1"}}, {"id": 131, "text": "different", "bbox": {"l": 184.33333333333334, "t": 331.0, "r": 217.66666666666666, "b": 338.0, "coord_origin": "1"}}, {"id": 132, "text": "sizes", "bbox": {"l": 222.0, "t": 331.0, "r": 240.66666666666666, "b": 338.0, "coord_origin": "1"}}, {"id": 133, "text": "might", "bbox": {"l": 245.0, "t": 331.0, "r": 267.6666666666667, "b": 340.0, "coord_origin": "1"}}, {"id": 134, "text": "still", "bbox": {"l": 271.6666666666667, "t": 331.0, "r": 286.0, "b": 338.0, "coord_origin": "1"}}, {"id": 135, "text": "be", "bbox": {"l": 50.333333333333336, "t": 343.0, "r": 59.0, "b": 350.0, "coord_origin": "1"}}, {"id": 136, "text": "regarded", "bbox": {"l": 62.666666666666664, "t": 343.0, "r": 96.66666666666667, "b": 352.0, "coord_origin": "1"}}, {"id": 137, "text": "as", "bbox": {"l": 100.33333333333333, "t": 345.0, "r": 108.0, "b": 350.0, "coord_origin": "1"}}, {"id": 138, "text": "correct", "bbox": {"l": 111.66666666666667, "t": 344.3333333333333, "r": 138.66666666666666, "b": 350.0, "coord_origin": "1"}}, {"id": 139, "text": "due", "bbox": {"l": 142.33333333333334, "t": 343.0, "r": 156.0, "b": 350.0, "coord_origin": "1"}}, {"id": 140, "text": "to", "bbox": {"l": 159.66666666666666, "t": 344.3333333333333, "r": 167.0, "b": 350.0, "coord_origin": "1"}}, {"id": 141, "text": "implicit", "bbox": {"l": 170.66666666666666, "t": 343.0, "r": 201.0, "b": 352.0, "coord_origin": "1"}}, {"id": 142, "text": "display", "bbox": {"l": 204.33333333333334, "t": 343.0, "r": 232.33333333333334, "b": 352.0, "coord_origin": "1"}}, {"id": 143, "text": "rules.", "bbox": {"l": 236.33333333333334, "t": 343.0, "r": 257.3333333333333, "b": 350.0, "coord_origin": "1"}}, {"id": 144, "text": "These", "bbox": {"l": 262.6666666666667, "t": 343.0, "r": 286.0, "b": 350.0, "coord_origin": "1"}}, {"id": 145, "text": "implicit", "bbox": {"l": 50.333333333333336, "t": 355.0, "r": 80.66666666666667, "b": 364.0, "coord_origin": "1"}}, {"id": 146, "text": "rules", "bbox": {"l": 84.33333333333333, "t": 355.0, "r": 103.33333333333333, "b": 362.0, "coord_origin": "1"}}, {"id": 147, "text": "leave", "bbox": {"l": 107.0, "t": 355.0, "r": 126.66666666666667, "b": 362.0, "coord_origin": "1"}}, {"id": 148, "text": "room", "bbox": {"l": 130.33333333333334, "t": 357.0, "r": 151.0, "b": 362.0, "coord_origin": "1"}}, {"id": 149, "text": "for", "bbox": {"l": 154.66666666666666, "t": 355.0, "r": 165.66666666666666, "b": 362.0, "coord_origin": "1"}}, {"id": 150, "text": "ambiguity,", "bbox": {"l": 169.0, "t": 355.0, "r": 210.66666666666666, "b": 364.0, "coord_origin": "1"}}, {"id": 151, "text": "which", "bbox": {"l": 214.66666666666666, "t": 355.0, "r": 238.33333333333334, "b": 362.0, "coord_origin": "1"}}, {"id": 152, "text": "we", "bbox": {"l": 242.0, "t": 357.0, "r": 252.66666666666666, "b": 362.0, "coord_origin": "1"}}, {"id": 153, "text": "want", "bbox": {"l": 256.6666666666667, "t": 356.3333333333333, "r": 275.3333333333333, "b": 362.0, "coord_origin": "1"}}, {"id": 154, "text": "to", "bbox": {"l": 279.0, "t": 356.3333333333333, "r": 286.0, "b": 362.0, "coord_origin": "1"}}, {"id": 155, "text": "avoid.", "bbox": {"l": 50.333333333333336, "t": 367.0, "r": 73.66666666666667, "b": 374.0, "coord_origin": "1"}}, {"id": 156, "text": "As", "bbox": {"l": 78.0, "t": 367.0, "r": 88.66666666666667, "b": 374.0, "coord_origin": "1"}}, {"id": 157, "text": "such,", "bbox": {"l": 92.0, "t": 367.0, "r": 112.0, "b": 374.6666666666667, "coord_origin": "1"}}, {"id": 158, "text": "we", "bbox": {"l": 115.66666666666667, "t": 369.0, "r": 126.33333333333333, "b": 374.0, "coord_origin": "1"}}, {"id": 159, "text": "prefer", "bbox": {"l": 129.66666666666666, "t": 367.0, "r": 153.33333333333334, "b": 376.0, "coord_origin": "1"}}, {"id": 160, "text": "to", "bbox": {"l": 156.33333333333334, "t": 368.3333333333333, "r": 163.33333333333334, "b": 374.0, "coord_origin": "1"}}, {"id": 161, "text": "have", "bbox": {"l": 166.33333333333334, "t": 367.0, "r": 184.33333333333334, "b": 374.0, "coord_origin": "1"}}, {"id": 162, "text": "\u201cstrict\u201d", "bbox": {"l": 187.66666666666666, "t": 367.0, "r": 215.66666666666666, "b": 374.0, "coord_origin": "1"}}, {"id": 163, "text": "tables,", "bbox": {"l": 219.0, "t": 367.0, "r": 244.0, "b": 374.6666666666667, "coord_origin": "1"}}, {"id": 164, "text": "i.e.", "bbox": {"l": 247.66666666666666, "t": 367.0, "r": 258.6666666666667, "b": 374.0, "coord_origin": "1"}}, {"id": 165, "text": "tables", "bbox": {"l": 263.3333333333333, "t": 367.0, "r": 286.0, "b": 374.0, "coord_origin": "1"}}, {"id": 166, "text": "where", "bbox": {"l": 50.333333333333336, "t": 379.0, "r": 74.0, "b": 386.0, "coord_origin": "1"}}, {"id": 167, "text": "every", "bbox": {"l": 77.0, "t": 381.0, "r": 98.0, "b": 388.0, "coord_origin": "1"}}, {"id": 168, "text": "row", "bbox": {"l": 101.33333333333333, "t": 381.0, "r": 116.0, "b": 386.0, "coord_origin": "1"}}, {"id": 169, "text": "has", "bbox": {"l": 119.0, "t": 379.0, "r": 131.66666666666666, "b": 386.0, "coord_origin": "1"}}, {"id": 170, "text": "exactly", "bbox": {"l": 134.66666666666666, "t": 379.0, "r": 162.66666666666666, "b": 388.0, "coord_origin": "1"}}, {"id": 171, "text": "the", "bbox": {"l": 166.0, "t": 379.0, "r": 177.66666666666666, "b": 386.0, "coord_origin": "1"}}, {"id": 172, "text": "same", "bbox": {"l": 180.66666666666666, "t": 381.0, "r": 200.66666666666666, "b": 386.0, "coord_origin": "1"}}, {"id": 173, "text": "length.", "bbox": {"l": 203.66666666666666, "t": 379.0, "r": 230.0, "b": 388.0, "coord_origin": "1"}}]}, "text": "As a first step of our data preparation process, we have calculated statistics over the datasets across the following dimensions: (1) table size measured in the number of rows and columns, (2) complexity of the table, (3) strictness of the provided HTML structure and (4) completeness (i.e. no omitted bounding boxes). A table is considered to be simple if it does not contain row spans or column spans. Additionally, a table has a strict HTML structure if every row has the same number of columns after taking into account any row or column spans. Therefore a strict HTML structure looks always rectangular. However, HTML is a lenient encoding format, i.e. tables with rows of different sizes might still be regarded as correct due to implicit display rules. These implicit rules leave room for ambiguity, which we want to avoid. As such, we prefer to have \u201cstrict\u201d tables, i.e. tables where every row has exactly the same length."}, {"label": "Text", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "Text", "bbox": {"l": 49.640533447265625, "t": 390.59295654296875, "r": 286.6666666666667, "b": 627.3333333333334, "coord_origin": "1"}, "confidence": 0.987933337688446, "cells": [{"id": 174, "text": "We", "bbox": {"l": 62.333333333333336, "t": 391.0, "r": 74.66666666666667, "b": 398.0, "coord_origin": "1"}}, {"id": 175, "text": "have", "bbox": {"l": 80.0, "t": 391.0, "r": 97.66666666666667, "b": 398.0, "coord_origin": "1"}}, {"id": 176, "text": "developed", "bbox": {"l": 102.66666666666667, "t": 391.0, "r": 142.66666666666666, "b": 400.0, "coord_origin": "1"}}, {"id": 177, "text": "a", "bbox": {"l": 147.66666666666666, "t": 393.0, "r": 151.66666666666666, "b": 398.0, "coord_origin": "1"}}, {"id": 178, "text": "technique", "bbox": {"l": 156.66666666666666, "t": 391.0, "r": 194.66666666666666, "b": 400.0, "coord_origin": "1"}}, {"id": 179, "text": "that", "bbox": {"l": 200.0, "t": 391.0, "r": 214.33333333333334, "b": 398.0, "coord_origin": "1"}}, {"id": 180, "text": "tries", "bbox": {"l": 219.33333333333334, "t": 391.0, "r": 235.66666666666666, "b": 398.0, "coord_origin": "1"}}, {"id": 181, "text": "to", "bbox": {"l": 241.0, "t": 392.3333333333333, "r": 248.33333333333334, "b": 398.0, "coord_origin": "1"}}, {"id": 182, "text": "derive", "bbox": {"l": 253.0, "t": 391.0, "r": 277.0, "b": 398.0, "coord_origin": "1"}}, {"id": 183, "text": "a", "bbox": {"l": 282.3333333333333, "t": 393.0, "r": 286.3333333333333, "b": 398.0, "coord_origin": "1"}}, {"id": 184, "text": "missing", "bbox": {"l": 50.333333333333336, "t": 403.0, "r": 80.66666666666667, "b": 412.0, "coord_origin": "1"}}, {"id": 185, "text": "bounding", "bbox": {"l": 84.33333333333333, "t": 403.0, "r": 121.33333333333333, "b": 412.0, "coord_origin": "1"}}, {"id": 186, "text": "box", "bbox": {"l": 125.0, "t": 403.0, "r": 139.0, "b": 410.0, "coord_origin": "1"}}, {"id": 187, "text": "out", "bbox": {"l": 142.66666666666666, "t": 404.3333333333333, "r": 155.0, "b": 410.0, "coord_origin": "1"}}, {"id": 188, "text": "of", "bbox": {"l": 158.33333333333334, "t": 403.0, "r": 167.0, "b": 410.0, "coord_origin": "1"}}, {"id": 189, "text": "its", "bbox": {"l": 169.66666666666666, "t": 403.0, "r": 178.66666666666666, "b": 410.0, "coord_origin": "1"}}, {"id": 190, "text": "neighbors.", "bbox": {"l": 182.0, "t": 403.0, "r": 222.66666666666666, "b": 412.0, "coord_origin": "1"}}, {"id": 191, "text": "As", "bbox": {"l": 228.33333333333334, "t": 403.0, "r": 238.66666666666666, "b": 410.0, "coord_origin": "1"}}, {"id": 192, "text": "a", "bbox": {"l": 239.33333333333334, "t": 401.6666666666667, "r": 243.66666666666666, "b": 413.3333333333333, "coord_origin": "1"}}, {"id": 193, "text": "first", "bbox": {"l": 250.0, "t": 403.0, "r": 264.6666666666667, "b": 410.0, "coord_origin": "1"}}, {"id": 194, "text": "step,", "bbox": {"l": 268.3333333333333, "t": 404.3333333333333, "r": 285.6666666666667, "b": 412.0, "coord_origin": "1"}}, {"id": 195, "text": "we", "bbox": {"l": 50.333333333333336, "t": 417.0, "r": 61.333333333333336, "b": 422.0, "coord_origin": "1"}}, {"id": 196, "text": "use", "bbox": {"l": 64.33333333333333, "t": 417.0, "r": 76.66666666666667, "b": 422.0, "coord_origin": "1"}}, {"id": 197, "text": "the", "bbox": {"l": 79.66666666666667, "t": 415.0, "r": 91.0, "b": 422.0, "coord_origin": "1"}}, {"id": 198, "text": "annotation", "bbox": {"l": 94.0, "t": 415.0, "r": 135.33333333333334, "b": 422.0, "coord_origin": "1"}}, {"id": 199, "text": "data", "bbox": {"l": 138.0, "t": 415.0, "r": 154.33333333333334, "b": 422.0, "coord_origin": "1"}}, {"id": 200, "text": "to", "bbox": {"l": 156.66666666666666, "t": 416.3333333333333, "r": 164.0, "b": 422.0, "coord_origin": "1"}}, {"id": 201, "text": "generate", "bbox": {"l": 166.66666666666666, "t": 416.3333333333333, "r": 199.66666666666666, "b": 424.0, "coord_origin": "1"}}, {"id": 202, "text": "the", "bbox": {"l": 202.66666666666666, "t": 415.0, "r": 214.0, "b": 422.0, "coord_origin": "1"}}, {"id": 203, "text": "most", "bbox": {"l": 217.0, "t": 416.3333333333333, "r": 235.66666666666666, "b": 422.0, "coord_origin": "1"}}, {"id": 204, "text": "fine-grained", "bbox": {"l": 238.66666666666666, "t": 415.0, "r": 286.0, "b": 424.0, "coord_origin": "1"}}, {"id": 205, "text": "grid", "bbox": {"l": 50.333333333333336, "t": 427.0, "r": 65.66666666666667, "b": 436.0, "coord_origin": "1"}}, {"id": 206, "text": "that", "bbox": {"l": 69.33333333333333, "t": 427.0, "r": 83.33333333333333, "b": 434.0, "coord_origin": "1"}}, {"id": 207, "text": "covers", "bbox": {"l": 86.66666666666667, "t": 429.0, "r": 112.0, "b": 434.0, "coord_origin": "1"}}, {"id": 208, "text": "the", "bbox": {"l": 115.33333333333333, "t": 427.0, "r": 126.66666666666667, "b": 434.0, "coord_origin": "1"}}, {"id": 209, "text": "table", "bbox": {"l": 130.33333333333334, "t": 427.0, "r": 149.0, "b": 434.0, "coord_origin": "1"}}, {"id": 210, "text": "structure.", "bbox": {"l": 152.66666666666666, "t": 428.3333333333333, "r": 188.66666666666666, "b": 434.0, "coord_origin": "1"}}, {"id": 211, "text": "In", "bbox": {"l": 193.66666666666666, "t": 427.0, "r": 201.33333333333334, "b": 434.0, "coord_origin": "1"}}, {"id": 212, "text": "case", "bbox": {"l": 204.66666666666666, "t": 429.0, "r": 221.33333333333334, "b": 434.0, "coord_origin": "1"}}, {"id": 213, "text": "of", "bbox": {"l": 224.66666666666666, "t": 427.0, "r": 233.0, "b": 434.0, "coord_origin": "1"}}, {"id": 214, "text": "strict", "bbox": {"l": 235.66666666666666, "t": 427.0, "r": 255.0, "b": 434.0, "coord_origin": "1"}}, {"id": 215, "text": "HTML", "bbox": {"l": 258.3333333333333, "t": 427.0, "r": 286.0, "b": 434.0, "coord_origin": "1"}}, {"id": 216, "text": "tables,", "bbox": {"l": 50.333333333333336, "t": 439.0, "r": 75.33333333333333, "b": 446.6666666666667, "coord_origin": "1"}}, {"id": 217, "text": "all", "bbox": {"l": 79.66666666666667, "t": 439.0, "r": 88.66666666666667, "b": 446.0, "coord_origin": "1"}}, {"id": 218, "text": "grid", "bbox": {"l": 92.66666666666667, "t": 439.0, "r": 108.0, "b": 448.0, "coord_origin": "1"}}, {"id": 219, "text": "squares", "bbox": {"l": 112.0, "t": 441.0, "r": 141.33333333333334, "b": 448.0, "coord_origin": "1"}}, {"id": 220, "text": "are", "bbox": {"l": 145.0, "t": 441.0, "r": 156.33333333333334, "b": 446.0, "coord_origin": "1"}}, {"id": 221, "text": "associated", "bbox": {"l": 160.33333333333334, "t": 439.0, "r": 200.66666666666666, "b": 446.0, "coord_origin": "1"}}, {"id": 222, "text": "with", "bbox": {"l": 204.66666666666666, "t": 439.0, "r": 221.66666666666666, "b": 446.0, "coord_origin": "1"}}, {"id": 223, "text": "some", "bbox": {"l": 225.66666666666666, "t": 441.0, "r": 245.66666666666666, "b": 446.0, "coord_origin": "1"}}, {"id": 224, "text": "table", "bbox": {"l": 249.66666666666666, "t": 439.0, "r": 268.3333333333333, "b": 446.0, "coord_origin": "1"}}, {"id": 225, "text": "cell", "bbox": {"l": 272.0, "t": 439.0, "r": 286.0, "b": 446.0, "coord_origin": "1"}}, {"id": 226, "text": "and", "bbox": {"l": 50.333333333333336, "t": 451.0, "r": 64.0, "b": 458.0, "coord_origin": "1"}}, {"id": 227, "text": "in", "bbox": {"l": 67.0, "t": 451.0, "r": 74.0, "b": 458.0, "coord_origin": "1"}}, {"id": 228, "text": "the", "bbox": {"l": 77.0, "t": 451.0, "r": 88.33333333333333, "b": 458.0, "coord_origin": "1"}}, {"id": 229, "text": "presence", "bbox": {"l": 91.33333333333333, "t": 453.0, "r": 125.33333333333333, "b": 460.0, "coord_origin": "1"}}, {"id": 230, "text": "of", "bbox": {"l": 128.33333333333334, "t": 451.0, "r": 137.0, "b": 458.0, "coord_origin": "1"}}, {"id": 231, "text": "table", "bbox": {"l": 139.0, "t": 451.0, "r": 157.66666666666666, "b": 458.0, "coord_origin": "1"}}, {"id": 232, "text": "spans", "bbox": {"l": 160.66666666666666, "t": 453.0, "r": 182.0, "b": 460.3333333333333, "coord_origin": "1"}}, {"id": 233, "text": "a", "bbox": {"l": 184.66666666666666, "t": 453.0, "r": 189.0, "b": 458.0, "coord_origin": "1"}}, {"id": 234, "text": "cell", "bbox": {"l": 191.33333333333334, "t": 451.0, "r": 205.0, "b": 458.0, "coord_origin": "1"}}, {"id": 235, "text": "extends", "bbox": {"l": 208.0, "t": 451.0, "r": 237.66666666666666, "b": 458.0, "coord_origin": "1"}}, {"id": 236, "text": "across", "bbox": {"l": 240.66666666666666, "t": 453.0, "r": 265.0, "b": 458.0, "coord_origin": "1"}}, {"id": 237, "text": "mul-", "bbox": {"l": 268.0, "t": 451.0, "r": 286.0, "b": 458.0, "coord_origin": "1"}}, {"id": 238, "text": "tiple", "bbox": {"l": 50.333333333333336, "t": 462.6666666666667, "r": 67.33333333333333, "b": 471.6666666666667, "coord_origin": "1"}}, {"id": 239, "text": "grid", "bbox": {"l": 70.0, "t": 462.6666666666667, "r": 85.33333333333333, "b": 471.6666666666667, "coord_origin": "1"}}, {"id": 240, "text": "squares.", "bbox": {"l": 88.33333333333333, "t": 464.6666666666667, "r": 119.66666666666667, "b": 471.6666666666667, "coord_origin": "1"}}, {"id": 241, "text": "When", "bbox": {"l": 123.33333333333333, "t": 462.6666666666667, "r": 146.66666666666666, "b": 469.3333333333333, "coord_origin": "1"}}, {"id": 242, "text": "enough", "bbox": {"l": 149.33333333333334, "t": 462.6666666666667, "r": 178.0, "b": 471.6666666666667, "coord_origin": "1"}}, {"id": 243, "text": "bounding", "bbox": {"l": 180.66666666666666, "t": 462.6666666666667, "r": 217.66666666666666, "b": 471.6666666666667, "coord_origin": "1"}}, {"id": 244, "text": "boxes", "bbox": {"l": 220.33333333333334, "t": 462.6666666666667, "r": 243.0, "b": 469.3333333333333, "coord_origin": "1"}}, {"id": 245, "text": "are", "bbox": {"l": 245.66666666666666, "t": 464.6666666666667, "r": 257.0, "b": 469.3333333333333, "coord_origin": "1"}}, {"id": 246, "text": "known", "bbox": {"l": 259.6666666666667, "t": 462.6666666666667, "r": 286.0, "b": 469.3333333333333, "coord_origin": "1"}}, {"id": 247, "text": "for", "bbox": {"l": 50.666666666666664, "t": 474.6666666666667, "r": 61.666666666666664, "b": 481.3333333333333, "coord_origin": "1"}}, {"id": 248, "text": "a", "bbox": {"l": 65.66666666666667, "t": 476.6666666666667, "r": 69.66666666666667, "b": 481.3333333333333, "coord_origin": "1"}}, {"id": 249, "text": "rectangular", "bbox": {"l": 73.66666666666667, "t": 474.6666666666667, "r": 118.33333333333333, "b": 483.6666666666667, "coord_origin": "1"}}, {"id": 250, "text": "table,", "bbox": {"l": 122.0, "t": 474.6666666666667, "r": 143.33333333333334, "b": 482.3333333333333, "coord_origin": "1"}}, {"id": 251, "text": "it", "bbox": {"l": 148.0, "t": 474.6666666666667, "r": 152.66666666666666, "b": 481.3333333333333, "coord_origin": "1"}}, {"id": 252, "text": "is", "bbox": {"l": 157.33333333333334, "t": 474.6666666666667, "r": 163.33333333333334, "b": 481.3333333333333, "coord_origin": "1"}}, {"id": 253, "text": "possible", "bbox": {"l": 167.33333333333334, "t": 474.6666666666667, "r": 199.33333333333334, "b": 483.6666666666667, "coord_origin": "1"}}, {"id": 254, "text": "to", "bbox": {"l": 203.66666666666666, "t": 475.6666666666667, "r": 211.0, "b": 481.3333333333333, "coord_origin": "1"}}, {"id": 255, "text": "compute", "bbox": {"l": 215.0, "t": 475.6666666666667, "r": 248.66666666666666, "b": 483.6666666666667, "coord_origin": "1"}}, {"id": 256, "text": "the", "bbox": {"l": 253.33333333333334, "t": 474.6666666666667, "r": 264.6666666666667, "b": 481.3333333333333, "coord_origin": "1"}}, {"id": 257, "text": "geo-", "bbox": {"l": 268.6666666666667, "t": 476.6666666666667, "r": 286.0, "b": 483.6666666666667, "coord_origin": "1"}}, {"id": 258, "text": "metrical", "bbox": {"l": 50.333333333333336, "t": 486.6666666666667, "r": 82.33333333333333, "b": 493.6666666666667, "coord_origin": "1"}}, {"id": 259, "text": "border", "bbox": {"l": 86.33333333333333, "t": 486.6666666666667, "r": 112.33333333333333, "b": 493.3333333333333, "coord_origin": "1"}}, {"id": 260, "text": "lines", "bbox": {"l": 116.0, "t": 486.6666666666667, "r": 134.0, "b": 493.3333333333333, "coord_origin": "1"}}, {"id": 261, "text": "between", "bbox": {"l": 138.0, "t": 486.6666666666667, "r": 170.66666666666666, "b": 493.3333333333333, "coord_origin": "1"}}, {"id": 262, "text": "the", "bbox": {"l": 174.66666666666666, "t": 486.6666666666667, "r": 186.33333333333334, "b": 493.3333333333333, "coord_origin": "1"}}, {"id": 263, "text": "grid", "bbox": {"l": 190.33333333333334, "t": 486.6666666666667, "r": 206.0, "b": 495.6666666666667, "coord_origin": "1"}}, {"id": 264, "text": "rows", "bbox": {"l": 210.0, "t": 488.6666666666667, "r": 228.33333333333334, "b": 493.3333333333333, "coord_origin": "1"}}, {"id": 265, "text": "and", "bbox": {"l": 232.33333333333334, "t": 486.6666666666667, "r": 246.33333333333334, "b": 493.3333333333333, "coord_origin": "1"}}, {"id": 266, "text": "columns.", "bbox": {"l": 250.33333333333334, "t": 486.6666666666667, "r": 285.6666666666667, "b": 493.6666666666667, "coord_origin": "1"}}, {"id": 267, "text": "Eventually", "bbox": {"l": 50.333333333333336, "t": 498.6666666666667, "r": 92.66666666666667, "b": 507.6666666666667, "coord_origin": "1"}}, {"id": 268, "text": "this", "bbox": {"l": 96.33333333333333, "t": 498.6666666666667, "r": 110.0, "b": 505.3333333333333, "coord_origin": "1"}}, {"id": 269, "text": "information", "bbox": {"l": 113.33333333333333, "t": 498.6666666666667, "r": 159.66666666666666, "b": 505.3333333333333, "coord_origin": "1"}}, {"id": 270, "text": "is", "bbox": {"l": 163.33333333333334, "t": 498.6666666666667, "r": 169.0, "b": 505.3333333333333, "coord_origin": "1"}}, {"id": 271, "text": "used", "bbox": {"l": 172.66666666666666, "t": 498.6666666666667, "r": 190.0, "b": 505.6666666666667, "coord_origin": "1"}}, {"id": 272, "text": "to", "bbox": {"l": 193.66666666666666, "t": 499.6666666666667, "r": 200.66666666666666, "b": 505.3333333333333, "coord_origin": "1"}}, {"id": 273, "text": "generate", "bbox": {"l": 204.0, "t": 500.0, "r": 237.33333333333334, "b": 507.6666666666667, "coord_origin": "1"}}, {"id": 274, "text": "the", "bbox": {"l": 240.66666666666666, "t": 498.6666666666667, "r": 252.0, "b": 505.6666666666667, "coord_origin": "1"}}, {"id": 275, "text": "missing", "bbox": {"l": 255.66666666666666, "t": 498.6666666666667, "r": 286.0, "b": 507.6666666666667, "coord_origin": "1"}}, {"id": 276, "text": "bounding", "bbox": {"l": 50.333333333333336, "t": 510.6666666666667, "r": 87.33333333333333, "b": 519.6666666666666, "coord_origin": "1"}}, {"id": 277, "text": "boxes.", "bbox": {"l": 90.66666666666667, "t": 510.6666666666667, "r": 115.33333333333333, "b": 517.6666666666666, "coord_origin": "1"}}, {"id": 278, "text": "Additionally,", "bbox": {"l": 119.66666666666667, "t": 510.6666666666667, "r": 171.0, "b": 519.6666666666666, "coord_origin": "1"}}, {"id": 279, "text": "the", "bbox": {"l": 174.66666666666666, "t": 510.6666666666667, "r": 186.0, "b": 517.6666666666666, "coord_origin": "1"}}, {"id": 280, "text": "existence", "bbox": {"l": 189.0, "t": 510.6666666666667, "r": 225.66666666666666, "b": 517.6666666666666, "coord_origin": "1"}}, {"id": 281, "text": "of", "bbox": {"l": 228.66666666666666, "t": 510.6666666666667, "r": 237.33333333333334, "b": 517.3333333333334, "coord_origin": "1"}}, {"id": 282, "text": "unused", "bbox": {"l": 240.0, "t": 510.6666666666667, "r": 267.3333333333333, "b": 517.6666666666666, "coord_origin": "1"}}, {"id": 283, "text": "grid", "bbox": {"l": 270.3333333333333, "t": 510.6666666666667, "r": 286.0, "b": 519.6666666666666, "coord_origin": "1"}}, {"id": 284, "text": "squares", "bbox": {"l": 50.333333333333336, "t": 524.6666666666666, "r": 79.66666666666667, "b": 531.6666666666666, "coord_origin": "1"}}, {"id": 285, "text": "indicates", "bbox": {"l": 83.33333333333333, "t": 522.6666666666666, "r": 118.0, "b": 529.6666666666666, "coord_origin": "1"}}, {"id": 286, "text": "that", "bbox": {"l": 122.0, "t": 522.6666666666666, "r": 136.33333333333334, "b": 529.6666666666666, "coord_origin": "1"}}, {"id": 287, "text": "the", "bbox": {"l": 140.0, "t": 522.6666666666666, "r": 151.33333333333334, "b": 529.6666666666666, "coord_origin": "1"}}, {"id": 288, "text": "table", "bbox": {"l": 155.33333333333334, "t": 522.6666666666666, "r": 174.0, "b": 529.6666666666666, "coord_origin": "1"}}, {"id": 289, "text": "rows", "bbox": {"l": 177.66666666666666, "t": 524.6666666666666, "r": 196.0, "b": 529.3333333333334, "coord_origin": "1"}}, {"id": 290, "text": "have", "bbox": {"l": 200.0, "t": 522.6666666666666, "r": 217.66666666666666, "b": 529.6666666666666, "coord_origin": "1"}}, {"id": 291, "text": "unequal", "bbox": {"l": 221.66666666666666, "t": 522.6666666666666, "r": 252.33333333333334, "b": 531.6666666666666, "coord_origin": "1"}}, {"id": 292, "text": "number", "bbox": {"l": 256.3333333333333, "t": 522.6666666666666, "r": 286.3333333333333, "b": 529.6666666666666, "coord_origin": "1"}}, {"id": 293, "text": "of", "bbox": {"l": 50.333333333333336, "t": 534.6666666666666, "r": 59.0, "b": 541.3333333333334, "coord_origin": "1"}}, {"id": 294, "text": "columns", "bbox": {"l": 61.0, "t": 534.6666666666666, "r": 94.33333333333333, "b": 541.6666666666666, "coord_origin": "1"}}, {"id": 295, "text": "and", "bbox": {"l": 97.66666666666667, "t": 534.6666666666666, "r": 111.33333333333333, "b": 541.6666666666666, "coord_origin": "1"}}, {"id": 296, "text": "the", "bbox": {"l": 114.66666666666667, "t": 534.6666666666666, "r": 126.33333333333333, "b": 541.6666666666666, "coord_origin": "1"}}, {"id": 297, "text": "overall", "bbox": {"l": 129.66666666666666, "t": 534.6666666666666, "r": 156.33333333333334, "b": 541.6666666666666, "coord_origin": "1"}}, {"id": 298, "text": "structure", "bbox": {"l": 159.66666666666666, "t": 536.0, "r": 193.66666666666666, "b": 541.6666666666666, "coord_origin": "1"}}, {"id": 299, "text": "is", "bbox": {"l": 197.33333333333334, "t": 534.6666666666666, "r": 203.33333333333334, "b": 541.3333333333334, "coord_origin": "1"}}, {"id": 300, "text": "non-strict.", "bbox": {"l": 206.66666666666666, "t": 534.6666666666666, "r": 246.0, "b": 541.6666666666666, "coord_origin": "1"}}, {"id": 301, "text": "The", "bbox": {"l": 250.66666666666666, "t": 534.6666666666666, "r": 265.6666666666667, "b": 541.6666666666666, "coord_origin": "1"}}, {"id": 302, "text": "gen-", "bbox": {"l": 268.6666666666667, "t": 536.6666666666666, "r": 286.0, "b": 543.6666666666666, "coord_origin": "1"}}, {"id": 303, "text": "eration", "bbox": {"l": 50.333333333333336, "t": 546.6666666666666, "r": 77.33333333333333, "b": 553.6666666666666, "coord_origin": "1"}}, {"id": 304, "text": "of", "bbox": {"l": 80.33333333333333, "t": 546.6666666666666, "r": 89.0, "b": 553.3333333333334, "coord_origin": "1"}}, {"id": 305, "text": "missing", "bbox": {"l": 91.33333333333333, "t": 546.6666666666666, "r": 121.66666666666667, "b": 555.6666666666666, "coord_origin": "1"}}, {"id": 306, "text": "bounding", "bbox": {"l": 125.0, "t": 546.6666666666666, "r": 162.0, "b": 555.6666666666666, "coord_origin": "1"}}, {"id": 307, "text": "boxes", "bbox": {"l": 165.0, "t": 546.6666666666666, "r": 187.33333333333334, "b": 553.6666666666666, "coord_origin": "1"}}, {"id": 308, "text": "for", "bbox": {"l": 190.66666666666666, "t": 546.6666666666666, "r": 202.0, "b": 553.3333333333334, "coord_origin": "1"}}, {"id": 309, "text": "non-strict", "bbox": {"l": 204.66666666666666, "t": 546.6666666666666, "r": 242.33333333333334, "b": 553.6666666666666, "coord_origin": "1"}}, {"id": 310, "text": "HTML", "bbox": {"l": 245.33333333333334, "t": 546.6666666666666, "r": 273.0, "b": 553.3333333333334, "coord_origin": "1"}}, {"id": 311, "text": "ta-", "bbox": {"l": 276.0, "t": 547.6666666666666, "r": 286.0, "b": 553.6666666666666, "coord_origin": "1"}}, {"id": 312, "text": "bles", "bbox": {"l": 50.333333333333336, "t": 558.6666666666666, "r": 65.66666666666667, "b": 565.6666666666666, "coord_origin": "1"}}, {"id": 313, "text": "is", "bbox": {"l": 70.0, "t": 558.6666666666666, "r": 76.0, "b": 565.3333333333334, "coord_origin": "1"}}, {"id": 314, "text": "ambiguous", "bbox": {"l": 80.0, "t": 558.6666666666666, "r": 123.33333333333333, "b": 567.6666666666666, "coord_origin": "1"}}, {"id": 315, "text": "and", "bbox": {"l": 127.66666666666667, "t": 558.6666666666666, "r": 141.33333333333334, "b": 565.6666666666666, "coord_origin": "1"}}, {"id": 316, "text": "therefore", "bbox": {"l": 145.66666666666666, "t": 558.6666666666666, "r": 181.0, "b": 565.6666666666666, "coord_origin": "1"}}, {"id": 317, "text": "quite", "bbox": {"l": 185.0, "t": 558.6666666666666, "r": 204.33333333333334, "b": 567.6666666666666, "coord_origin": "1"}}, {"id": 318, "text": "challenging.", "bbox": {"l": 208.66666666666666, "t": 558.6666666666666, "r": 256.6666666666667, "b": 567.6666666666666, "coord_origin": "1"}}, {"id": 319, "text": "Thus,", "bbox": {"l": 264.0, "t": 558.6666666666666, "r": 285.6666666666667, "b": 566.6666666666666, "coord_origin": "1"}}, {"id": 320, "text": "we", "bbox": {"l": 50.333333333333336, "t": 572.6666666666666, "r": 61.333333333333336, "b": 577.6666666666666, "coord_origin": "1"}}, {"id": 321, "text": "have", "bbox": {"l": 65.0, "t": 570.6666666666666, "r": 82.66666666666667, "b": 577.6666666666666, "coord_origin": "1"}}, {"id": 322, "text": "decided", "bbox": {"l": 86.33333333333333, "t": 570.6666666666666, "r": 116.66666666666667, "b": 577.6666666666666, "coord_origin": "1"}}, {"id": 323, "text": "to", "bbox": {"l": 120.33333333333333, "t": 572.0, "r": 127.66666666666667, "b": 577.6666666666666, "coord_origin": "1"}}, {"id": 324, "text": "simply", "bbox": {"l": 131.0, "t": 570.6666666666666, "r": 157.33333333333334, "b": 579.6666666666666, "coord_origin": "1"}}, {"id": 325, "text": "discard", "bbox": {"l": 161.0, "t": 570.6666666666666, "r": 189.33333333333334, "b": 577.6666666666666, "coord_origin": "1"}}, {"id": 326, "text": "those", "bbox": {"l": 192.66666666666666, "t": 570.6666666666666, "r": 213.0, "b": 577.6666666666666, "coord_origin": "1"}}, {"id": 327, "text": "tables.", "bbox": {"l": 216.66666666666666, "t": 570.6666666666666, "r": 241.66666666666666, "b": 577.6666666666666, "coord_origin": "1"}}, {"id": 328, "text": "In", "bbox": {"l": 247.0, "t": 570.6666666666666, "r": 254.66666666666666, "b": 577.3333333333334, "coord_origin": "1"}}, {"id": 329, "text": "case", "bbox": {"l": 258.0, "t": 572.6666666666666, "r": 274.6666666666667, "b": 577.6666666666666, "coord_origin": "1"}}, {"id": 330, "text": "of", "bbox": {"l": 278.3333333333333, "t": 570.6666666666666, "r": 286.6666666666667, "b": 577.3333333333334, "coord_origin": "1"}}, {"id": 331, "text": "PubTabNet", "bbox": {"l": 50.333333333333336, "t": 582.6666666666666, "r": 94.33333333333333, "b": 589.6666666666666, "coord_origin": "1"}}, {"id": 332, "text": "we", "bbox": {"l": 97.66666666666667, "t": 584.6666666666666, "r": 108.66666666666667, "b": 589.6666666666666, "coord_origin": "1"}}, {"id": 333, "text": "have", "bbox": {"l": 112.0, "t": 582.6666666666666, "r": 129.66666666666666, "b": 589.6666666666666, "coord_origin": "1"}}, {"id": 334, "text": "computed", "bbox": {"l": 133.0, "t": 582.6666666666666, "r": 171.66666666666666, "b": 591.6666666666666, "coord_origin": "1"}}, {"id": 335, "text": "missing", "bbox": {"l": 175.33333333333334, "t": 582.6666666666666, "r": 205.66666666666666, "b": 591.6666666666666, "coord_origin": "1"}}, {"id": 336, "text": "bounding", "bbox": {"l": 209.0, "t": 582.6666666666666, "r": 245.66666666666666, "b": 591.6666666666666, "coord_origin": "1"}}, {"id": 337, "text": "boxes", "bbox": {"l": 249.33333333333334, "t": 582.6666666666666, "r": 271.6666666666667, "b": 589.6666666666666, "coord_origin": "1"}}, {"id": 338, "text": "for", "bbox": {"l": 275.3333333333333, "t": 582.6666666666666, "r": 286.3333333333333, "b": 589.3333333333334, "coord_origin": "1"}}, {"id": 339, "text": "48%", "bbox": {"l": 50.0, "t": 594.0, "r": 67.66666666666667, "b": 601.0, "coord_origin": "1"}}, {"id": 340, "text": "of", "bbox": {"l": 71.0, "t": 594.0, "r": 79.66666666666667, "b": 601.0, "coord_origin": "1"}}, {"id": 341, "text": "the", "bbox": {"l": 82.0, "t": 594.0, "r": 93.33333333333333, "b": 601.0, "coord_origin": "1"}}, {"id": 342, "text": "simple", "bbox": {"l": 96.66666666666667, "t": 594.0, "r": 122.66666666666667, "b": 603.3333333333334, "coord_origin": "1"}}, {"id": 343, "text": "and", "bbox": {"l": 125.66666666666667, "t": 594.0, "r": 139.33333333333334, "b": 601.0, "coord_origin": "1"}}, {"id": 344, "text": "69%", "bbox": {"l": 142.66666666666666, "t": 594.3333333333334, "r": 160.33333333333334, "b": 601.0, "coord_origin": "1"}}, {"id": 345, "text": "of", "bbox": {"l": 163.33333333333334, "t": 594.0, "r": 172.0, "b": 601.0, "coord_origin": "1"}}, {"id": 346, "text": "the", "bbox": {"l": 174.33333333333334, "t": 594.0, "r": 185.66666666666666, "b": 601.0, "coord_origin": "1"}}, {"id": 347, "text": "complex", "bbox": {"l": 189.0, "t": 594.0, "r": 222.33333333333334, "b": 603.3333333333334, "coord_origin": "1"}}, {"id": 348, "text": "tables.", "bbox": {"l": 225.66666666666666, "t": 594.0, "r": 250.33333333333334, "b": 601.0, "coord_origin": "1"}}, {"id": 349, "text": "Regard-", "bbox": {"l": 254.66666666666666, "t": 594.0, "r": 286.0, "b": 603.3333333333334, "coord_origin": "1"}}, {"id": 350, "text": "ing", "bbox": {"l": 50.333333333333336, "t": 606.0, "r": 62.666666666666664, "b": 615.3333333333334, "coord_origin": "1"}}, {"id": 351, "text": "FinTabNet,", "bbox": {"l": 65.66666666666667, "t": 606.0, "r": 109.66666666666667, "b": 614.0, "coord_origin": "1"}}, {"id": 352, "text": "68%", "bbox": {"l": 113.33333333333333, "t": 606.0, "r": 130.66666666666666, "b": 613.0, "coord_origin": "1"}}, {"id": 353, "text": "of", "bbox": {"l": 134.0, "t": 606.0, "r": 142.66666666666666, "b": 613.0, "coord_origin": "1"}}, {"id": 354, "text": "the", "bbox": {"l": 145.0, "t": 606.0, "r": 156.33333333333334, "b": 613.0, "coord_origin": "1"}}, {"id": 355, "text": "simple", "bbox": {"l": 159.66666666666666, "t": 606.0, "r": 185.66666666666666, "b": 615.3333333333334, "coord_origin": "1"}}, {"id": 356, "text": "and", "bbox": {"l": 189.0, "t": 606.0, "r": 202.66666666666666, "b": 613.0, "coord_origin": "1"}}, {"id": 357, "text": "98%", "bbox": {"l": 205.66666666666666, "t": 606.0, "r": 223.33333333333334, "b": 613.0, "coord_origin": "1"}}, {"id": 358, "text": "of", "bbox": {"l": 226.66666666666666, "t": 606.0, "r": 235.33333333333334, "b": 613.0, "coord_origin": "1"}}, {"id": 359, "text": "the", "bbox": {"l": 237.66666666666666, "t": 606.0, "r": 249.33333333333334, "b": 613.0, "coord_origin": "1"}}, {"id": 360, "text": "complex", "bbox": {"l": 252.33333333333334, "t": 606.0, "r": 285.6666666666667, "b": 615.3333333333334, "coord_origin": "1"}}, {"id": 361, "text": "tables", "bbox": {"l": 50.333333333333336, "t": 618.0, "r": 73.0, "b": 625.0, "coord_origin": "1"}}, {"id": 362, "text": "require", "bbox": {"l": 76.0, "t": 618.0, "r": 103.66666666666667, "b": 627.3333333333334, "coord_origin": "1"}}, {"id": 363, "text": "the", "bbox": {"l": 106.66666666666667, "t": 618.0, "r": 118.33333333333333, "b": 625.0, "coord_origin": "1"}}, {"id": 364, "text": "generation", "bbox": {"l": 121.33333333333333, "t": 618.0, "r": 163.0, "b": 627.3333333333334, "coord_origin": "1"}}, {"id": 365, "text": "of", "bbox": {"l": 166.0, "t": 618.0, "r": 174.33333333333334, "b": 625.0, "coord_origin": "1"}}, {"id": 366, "text": "bounding", "bbox": {"l": 176.66666666666666, "t": 618.0, "r": 214.0, "b": 627.3333333333334, "coord_origin": "1"}}, {"id": 367, "text": "boxes.", "bbox": {"l": 217.0, "t": 618.0, "r": 241.66666666666666, "b": 625.0, "coord_origin": "1"}}]}, "text": "We have developed a technique that tries to derive a missing bounding box out of its neighbors. As a first step, we use the annotation data to generate the most fine-grained grid that covers the table structure. In case of strict HTML tables, all grid squares are associated with some table cell and in the presence of table spans a cell extends across multiple grid squares. When enough bounding boxes are known for a rectangular table, it is possible to compute the geometrical border lines between the grid rows and columns. Eventually this information is used to generate the missing bounding boxes. Additionally, the existence of unused grid squares indicates that the table rows have unequal number of columns and the overall structure is non-strict. The generation of missing bounding boxes for non-strict HTML tables is ambiguous and therefore quite challenging. Thus, we have decided to simply discard those tables. In case of PubTabNet we have computed missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes."}, {"label": "Text", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "Text", "bbox": {"l": 49.99413299560547, "t": 629.9431762695312, "r": 286.0, "b": 651.344970703125, "coord_origin": "1"}, "confidence": 0.9655510187149048, "cells": [{"id": 368, "text": "Figure", "bbox": {"l": 62.333333333333336, "t": 630.6666666666666, "r": 87.66666666666667, "b": 639.6666666666666, "coord_origin": "1"}}, {"id": 369, "text": "7", "bbox": {"l": 91.66666666666667, "t": 630.6666666666666, "r": 96.0, "b": 637.3333333333334, "coord_origin": "1"}}, {"id": 370, "text": "illustrates", "bbox": {"l": 100.33333333333333, "t": 630.6666666666666, "r": 138.33333333333334, "b": 637.6666666666666, "coord_origin": "1"}}, {"id": 371, "text": "the", "bbox": {"l": 142.66666666666666, "t": 630.6666666666666, "r": 154.0, "b": 637.6666666666666, "coord_origin": "1"}}, {"id": 372, "text": "distribution", "bbox": {"l": 158.0, "t": 630.6666666666666, "r": 203.33333333333334, "b": 637.6666666666666, "coord_origin": "1"}}, {"id": 373, "text": "of", "bbox": {"l": 207.33333333333334, "t": 630.6666666666666, "r": 216.0, "b": 637.3333333333334, "coord_origin": "1"}}, {"id": 374, "text": "the", "bbox": {"l": 219.33333333333334, "t": 630.6666666666666, "r": 230.66666666666666, "b": 637.6666666666666, "coord_origin": "1"}}, {"id": 375, "text": "tables", "bbox": {"l": 235.0, "t": 630.6666666666666, "r": 257.6666666666667, "b": 637.6666666666666, "coord_origin": "1"}}, {"id": 376, "text": "across", "bbox": {"l": 261.6666666666667, "t": 632.6666666666666, "r": 286.0, "b": 637.6666666666666, "coord_origin": "1"}}, {"id": 377, "text": "different", "bbox": {"l": 50.333333333333336, "t": 642.0, "r": 83.66666666666667, "b": 649.0, "coord_origin": "1"}}, {"id": 378, "text": "dimensions", "bbox": {"l": 86.66666666666667, "t": 642.0, "r": 131.66666666666666, "b": 649.0, "coord_origin": "1"}}, {"id": 379, "text": "per", "bbox": {"l": 134.66666666666666, "t": 644.3333333333334, "r": 147.33333333333334, "b": 651.3333333333334, "coord_origin": "1"}}, {"id": 380, "text": "dataset.", "bbox": {"l": 149.66666666666666, "t": 642.0, "r": 179.0, "b": 649.0, "coord_origin": "1"}}]}, "text": "Figure 7 illustrates the distribution of the tables across different dimensions per dataset."}, {"label": "Section-header", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "Section-header", "bbox": {"l": 49.898033142089844, "t": 661.9161987304688, "r": 153.34835815429688, "b": 672.0421752929688, "coord_origin": "1"}, "confidence": 0.9235464930534363, "cells": [{"id": 381, "text": "1.2.", "bbox": {"l": 51.0, "t": 662.0, "r": 66.0, "b": 669.6666666666666, "coord_origin": "1"}}, {"id": 382, "text": "Synthetic", "bbox": {"l": 69.66666666666667, "t": 662.0, "r": 113.0, "b": 672.0, "coord_origin": "1"}}, {"id": 383, "text": "datasets", "bbox": {"l": 116.0, "t": 662.0, "r": 153.33333333333334, "b": 669.6666666666666, "coord_origin": "1"}}]}, "text": "1.2. Synthetic datasets"}, {"label": "Text", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "Text", "bbox": {"l": 49.784549713134766, "t": 680.5510864257812, "r": 286.6666666666667, "b": 714.0, "coord_origin": "1"}, "confidence": 0.9784752130508423, "cells": [{"id": 384, "text": "Aiming", "bbox": {"l": 62.333333333333336, "t": 681.0, "r": 92.0, "b": 690.0, "coord_origin": "1"}}, {"id": 385, "text": "to", "bbox": {"l": 96.66666666666667, "t": 682.3333333333334, "r": 104.0, "b": 688.0, "coord_origin": "1"}}, {"id": 386, "text": "train", "bbox": {"l": 108.66666666666667, "t": 681.0, "r": 126.33333333333333, "b": 688.0, "coord_origin": "1"}}, {"id": 387, "text": "and", "bbox": {"l": 130.66666666666666, "t": 681.0, "r": 144.66666666666666, "b": 688.0, "coord_origin": "1"}}, {"id": 388, "text": "evaluate", "bbox": {"l": 149.0, "t": 681.0, "r": 181.0, "b": 688.0, "coord_origin": "1"}}, {"id": 389, "text": "our", "bbox": {"l": 185.66666666666666, "t": 683.0, "r": 199.0, "b": 688.0, "coord_origin": "1"}}, {"id": 390, "text": "models", "bbox": {"l": 203.33333333333334, "t": 681.0, "r": 231.33333333333334, "b": 688.0, "coord_origin": "1"}}, {"id": 391, "text": "in", "bbox": {"l": 236.0, "t": 681.0, "r": 243.0, "b": 688.0, "coord_origin": "1"}}, {"id": 392, "text": "a", "bbox": {"l": 247.66666666666666, "t": 683.0, "r": 251.66666666666666, "b": 688.0, "coord_origin": "1"}}, {"id": 393, "text": "broader", "bbox": {"l": 256.0, "t": 681.0, "r": 286.3333333333333, "b": 688.0, "coord_origin": "1"}}, {"id": 394, "text": "spectrum", "bbox": {"l": 50.333333333333336, "t": 694.3333333333334, "r": 86.33333333333333, "b": 702.0, "coord_origin": "1"}}, {"id": 395, "text": "of", "bbox": {"l": 90.33333333333333, "t": 693.0, "r": 99.0, "b": 700.0, "coord_origin": "1"}}, {"id": 396, "text": "table", "bbox": {"l": 102.66666666666667, "t": 693.0, "r": 121.0, "b": 700.0, "coord_origin": "1"}}, {"id": 397, "text": "data", "bbox": {"l": 125.33333333333333, "t": 693.0, "r": 141.66666666666666, "b": 700.0, "coord_origin": "1"}}, {"id": 398, "text": "we", "bbox": {"l": 146.0, "t": 695.0, "r": 156.66666666666666, "b": 700.0, "coord_origin": "1"}}, {"id": 399, "text": "have", "bbox": {"l": 161.0, "t": 693.0, "r": 179.0, "b": 700.0, "coord_origin": "1"}}, {"id": 400, "text": "synthesized", "bbox": {"l": 183.33333333333334, "t": 693.0, "r": 229.0, "b": 702.0, "coord_origin": "1"}}, {"id": 401, "text": "four", "bbox": {"l": 233.33333333333334, "t": 693.0, "r": 249.66666666666666, "b": 700.0, "coord_origin": "1"}}, {"id": 402, "text": "types", "bbox": {"l": 253.66666666666666, "t": 694.3333333333334, "r": 274.0, "b": 702.0, "coord_origin": "1"}}, {"id": 403, "text": "of", "bbox": {"l": 278.3333333333333, "t": 693.0, "r": 286.6666666666667, "b": 700.0, "coord_origin": "1"}}, {"id": 404, "text": "datasets.", "bbox": {"l": 50.333333333333336, "t": 705.0, "r": 83.33333333333333, "b": 712.0, "coord_origin": "1"}}, {"id": 405, "text": "Each", "bbox": {"l": 91.66666666666667, "t": 705.0, "r": 110.66666666666667, "b": 712.0, "coord_origin": "1"}}, {"id": 406, "text": "one", "bbox": {"l": 115.0, "t": 707.0, "r": 129.0, "b": 712.0, "coord_origin": "1"}}, {"id": 407, "text": "contains", "bbox": {"l": 133.33333333333334, "t": 705.0, "r": 166.0, "b": 712.0, "coord_origin": "1"}}, {"id": 408, "text": "tables", "bbox": {"l": 170.33333333333334, "t": 705.0, "r": 193.0, "b": 712.0, "coord_origin": "1"}}, {"id": 409, "text": "with", "bbox": {"l": 197.66666666666666, "t": 705.0, "r": 214.66666666666666, "b": 712.0, "coord_origin": "1"}}, {"id": 410, "text": "different", "bbox": {"l": 219.0, "t": 705.0, "r": 252.66666666666666, "b": 712.0, "coord_origin": "1"}}, {"id": 411, "text": "appear-", "bbox": {"l": 257.0, "t": 707.0, "r": 286.0, "b": 714.0, "coord_origin": "1"}}]}, "text": "Aiming to train and evaluate our models in a broader spectrum of table data we have synthesized four types of datasets. Each one contains tables with different appear-"}, {"label": "Text", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "Text", "bbox": {"l": 308.32464599609375, "t": 161.7657012939453, "r": 545.0006713867188, "b": 207.03915405273438, "coord_origin": "1"}, "confidence": 0.9791127443313599, "cells": [{"id": 412, "text": "ances", "bbox": {"l": 309.0, "t": 164.0, "r": 330.6666666666667, "b": 169.0, "coord_origin": "1"}}, {"id": 413, "text": "in", "bbox": {"l": 335.0, "t": 162.0, "r": 342.0, "b": 169.0, "coord_origin": "1"}}, {"id": 414, "text": "regard", "bbox": {"l": 346.6666666666667, "t": 162.0, "r": 371.0, "b": 171.0, "coord_origin": "1"}}, {"id": 415, "text": "to", "bbox": {"l": 375.6666666666667, "t": 163.33333333333337, "r": 383.0, "b": 169.0, "coord_origin": "1"}}, {"id": 416, "text": "their", "bbox": {"l": 387.3333333333333, "t": 162.0, "r": 405.0, "b": 169.0, "coord_origin": "1"}}, {"id": 417, "text": "size,", "bbox": {"l": 409.3333333333333, "t": 162.0, "r": 426.3333333333333, "b": 169.66666666666663, "coord_origin": "1"}}, {"id": 418, "text": "structure,", "bbox": {"l": 431.3333333333333, "t": 163.33333333333337, "r": 468.0, "b": 169.66666666666663, "coord_origin": "1"}}, {"id": 419, "text": "style", "bbox": {"l": 472.6666666666667, "t": 162.0, "r": 491.0, "b": 171.0, "coord_origin": "1"}}, {"id": 420, "text": "and", "bbox": {"l": 495.3333333333333, "t": 162.0, "r": 509.0, "b": 169.0, "coord_origin": "1"}}, {"id": 421, "text": "content.", "bbox": {"l": 513.3333333333334, "t": 163.33333333333337, "r": 544.3333333333334, "b": 169.0, "coord_origin": "1"}}, {"id": 422, "text": "Every", "bbox": {"l": 309.0, "t": 174.0, "r": 332.0, "b": 183.0, "coord_origin": "1"}}, {"id": 423, "text": "synthetic", "bbox": {"l": 336.0, "t": 174.0, "r": 371.0, "b": 183.0, "coord_origin": "1"}}, {"id": 424, "text": "dataset", "bbox": {"l": 374.6666666666667, "t": 174.0, "r": 402.0, "b": 181.0, "coord_origin": "1"}}, {"id": 425, "text": "contains", "bbox": {"l": 405.6666666666667, "t": 174.0, "r": 438.3333333333333, "b": 181.0, "coord_origin": "1"}}, {"id": 426, "text": "150k", "bbox": {"l": 443.3333333333333, "t": 174.0, "r": 461.3333333333333, "b": 181.0, "coord_origin": "1"}}, {"id": 427, "text": "examples,", "bbox": {"l": 465.0, "t": 174.0, "r": 504.0, "b": 183.0, "coord_origin": "1"}}, {"id": 428, "text": "summing", "bbox": {"l": 508.3333333333333, "t": 174.0, "r": 544.6666666666666, "b": 183.0, "coord_origin": "1"}}, {"id": 429, "text": "up", "bbox": {"l": 309.0, "t": 188.0, "r": 318.6666666666667, "b": 195.0, "coord_origin": "1"}}, {"id": 430, "text": "to", "bbox": {"l": 321.3333333333333, "t": 187.33333333333337, "r": 328.3333333333333, "b": 193.0, "coord_origin": "1"}}, {"id": 431, "text": "600k", "bbox": {"l": 331.3333333333333, "t": 186.0, "r": 350.6666666666667, "b": 193.0, "coord_origin": "1"}}, {"id": 432, "text": "synthetic", "bbox": {"l": 353.6666666666667, "t": 186.0, "r": 388.6666666666667, "b": 195.0, "coord_origin": "1"}}, {"id": 433, "text": "examples.", "bbox": {"l": 391.6666666666667, "t": 186.0, "r": 430.6666666666667, "b": 195.0, "coord_origin": "1"}}, {"id": 434, "text": "All", "bbox": {"l": 434.6666666666667, "t": 186.0, "r": 446.6666666666667, "b": 193.0, "coord_origin": "1"}}, {"id": 435, "text": "datasets", "bbox": {"l": 449.6666666666667, "t": 186.0, "r": 480.6666666666667, "b": 193.0, "coord_origin": "1"}}, {"id": 436, "text": "are", "bbox": {"l": 483.3333333333333, "t": 188.0, "r": 495.0, "b": 193.0, "coord_origin": "1"}}, {"id": 437, "text": "divided", "bbox": {"l": 497.6666666666667, "t": 186.0, "r": 527.0, "b": 193.0, "coord_origin": "1"}}, {"id": 438, "text": "into", "bbox": {"l": 530.0, "t": 186.0, "r": 545.0, "b": 193.0, "coord_origin": "1"}}, {"id": 439, "text": "Train,", "bbox": {"l": 309.0, "t": 198.0, "r": 332.0, "b": 205.66666666666663, "coord_origin": "1"}}, {"id": 440, "text": "Test", "bbox": {"l": 335.0, "t": 198.0, "r": 351.3333333333333, "b": 205.0, "coord_origin": "1"}}, {"id": 441, "text": "and", "bbox": {"l": 354.3333333333333, "t": 198.0, "r": 368.0, "b": 205.0, "coord_origin": "1"}}, {"id": 442, "text": "Val", "bbox": {"l": 371.0, "t": 198.0, "r": 383.6666666666667, "b": 205.0, "coord_origin": "1"}}, {"id": 443, "text": "splits", "bbox": {"l": 387.0, "t": 198.0, "r": 407.3333333333333, "b": 207.0, "coord_origin": "1"}}, {"id": 444, "text": "(80%,", "bbox": {"l": 410.3333333333333, "t": 198.0, "r": 433.6666666666667, "b": 206.33333333333337, "coord_origin": "1"}}, {"id": 445, "text": "10%,", "bbox": {"l": 438.0, "t": 198.0, "r": 457.0, "b": 205.66666666666663, "coord_origin": "1"}}, {"id": 446, "text": "10%).", "bbox": {"l": 461.3333333333333, "t": 198.0, "r": 483.3333333333333, "b": 206.33333333333337, "coord_origin": "1"}}]}, "text": "ances in regard to their size, structure, style and content. Every synthetic dataset contains 150k examples, summing up to 600k synthetic examples. All datasets are divided into Train, Test and Val splits (80%, 10%, 10%)."}, {"label": "Text", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "Text", "bbox": {"l": 308.44775390625, "t": 210.41331481933594, "r": 544.8419799804688, "b": 232.35369873046875, "coord_origin": "1"}, "confidence": 0.9645320773124695, "cells": [{"id": 447, "text": "The", "bbox": {"l": 321.0, "t": 211.0, "r": 336.0, "b": 218.0, "coord_origin": "1"}}, {"id": 448, "text": "process", "bbox": {"l": 339.3333333333333, "t": 213.0, "r": 368.6666666666667, "b": 220.0, "coord_origin": "1"}}, {"id": 449, "text": "of", "bbox": {"l": 372.0, "t": 211.0, "r": 380.3333333333333, "b": 218.0, "coord_origin": "1"}}, {"id": 450, "text": "generating", "bbox": {"l": 382.6666666666667, "t": 211.0, "r": 424.3333333333333, "b": 220.0, "coord_origin": "1"}}, {"id": 451, "text": "a", "bbox": {"l": 427.6666666666667, "t": 213.0, "r": 431.6666666666667, "b": 218.0, "coord_origin": "1"}}, {"id": 452, "text": "synthetic", "bbox": {"l": 435.0, "t": 211.0, "r": 470.0, "b": 220.0, "coord_origin": "1"}}, {"id": 453, "text": "dataset", "bbox": {"l": 473.3333333333333, "t": 211.0, "r": 500.6666666666667, "b": 218.0, "coord_origin": "1"}}, {"id": 454, "text": "can", "bbox": {"l": 504.0, "t": 213.0, "r": 517.0, "b": 218.0, "coord_origin": "1"}}, {"id": 455, "text": "be", "bbox": {"l": 520.6666666666666, "t": 211.0, "r": 529.0, "b": 218.0, "coord_origin": "1"}}, {"id": 456, "text": "de-", "bbox": {"l": 532.6666666666666, "t": 211.0, "r": 544.6666666666666, "b": 218.0, "coord_origin": "1"}}, {"id": 457, "text": "composed", "bbox": {"l": 309.0, "t": 223.0, "r": 348.6666666666667, "b": 232.0, "coord_origin": "1"}}, {"id": 458, "text": "into", "bbox": {"l": 352.0, "t": 223.0, "r": 367.0, "b": 230.0, "coord_origin": "1"}}, {"id": 459, "text": "the", "bbox": {"l": 370.0, "t": 223.0, "r": 381.3333333333333, "b": 230.0, "coord_origin": "1"}}, {"id": 460, "text": "following", "bbox": {"l": 384.6666666666667, "t": 223.0, "r": 422.3333333333333, "b": 232.0, "coord_origin": "1"}}, {"id": 461, "text": "steps:", "bbox": {"l": 425.6666666666667, "t": 224.33333333333337, "r": 447.0, "b": 232.0, "coord_origin": "1"}}]}, "text": "The process of generating a synthetic dataset can be decomposed into the following steps:"}, {"label": "Text", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "Text", "bbox": {"l": 308.4111022949219, "t": 235.2310333251953, "r": 545.0, "b": 316.1220397949219, "coord_origin": "1"}, "confidence": 0.9858567714691162, "cells": [{"id": 462, "text": "1.", "bbox": {"l": 322.3333333333333, "t": 235.66666666666663, "r": 327.3333333333333, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 463, "text": "Prepare", "bbox": {"l": 335.6666666666667, "t": 235.33333333333337, "r": 365.3333333333333, "b": 244.66666666666663, "coord_origin": "1"}}, {"id": 464, "text": "styling", "bbox": {"l": 370.0, "t": 235.33333333333337, "r": 396.3333333333333, "b": 244.66666666666663, "coord_origin": "1"}}, {"id": 465, "text": "and", "bbox": {"l": 400.6666666666667, "t": 235.33333333333337, "r": 414.6666666666667, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 466, "text": "content", "bbox": {"l": 419.0, "t": 236.66666666666663, "r": 447.6666666666667, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 467, "text": "templates:", "bbox": {"l": 452.3333333333333, "t": 235.33333333333337, "r": 492.0, "b": 244.66666666666663, "coord_origin": "1"}}, {"id": 468, "text": "The", "bbox": {"l": 498.6666666666667, "t": 235.33333333333337, "r": 513.6666666666666, "b": 242.33333333333337, "coord_origin": "1"}}, {"id": 469, "text": "styling", "bbox": {"l": 518.3333333333334, "t": 235.33333333333337, "r": 544.6666666666666, "b": 244.66666666666663, "coord_origin": "1"}}, {"id": 470, "text": "templates", "bbox": {"l": 309.0, "t": 247.33333333333337, "r": 346.6666666666667, "b": 256.66666666666674, "coord_origin": "1"}}, {"id": 471, "text": "have", "bbox": {"l": 350.0, "t": 247.33333333333337, "r": 368.0, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 472, "text": "been", "bbox": {"l": 371.3333333333333, "t": 247.33333333333337, "r": 389.3333333333333, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 473, "text": "manually", "bbox": {"l": 393.0, "t": 247.33333333333337, "r": 429.3333333333333, "b": 256.66666666666674, "coord_origin": "1"}}, {"id": 474, "text": "designed", "bbox": {"l": 432.3333333333333, "t": 247.33333333333337, "r": 467.3333333333333, "b": 256.66666666666674, "coord_origin": "1"}}, {"id": 475, "text": "and", "bbox": {"l": 471.0, "t": 247.33333333333337, "r": 484.6666666666667, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 476, "text": "organized", "bbox": {"l": 488.0, "t": 247.33333333333337, "r": 526.3333333333334, "b": 256.66666666666674, "coord_origin": "1"}}, {"id": 477, "text": "into", "bbox": {"l": 530.0, "t": 247.33333333333337, "r": 545.0, "b": 254.33333333333337, "coord_origin": "1"}}, {"id": 478, "text": "groups", "bbox": {"l": 309.0, "t": 261.66666666666674, "r": 335.6666666666667, "b": 268.66666666666674, "coord_origin": "1"}}, {"id": 479, "text": "of", "bbox": {"l": 339.6666666666667, "t": 259.33333333333326, "r": 348.3333333333333, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 480, "text": "scope", "bbox": {"l": 351.6666666666667, "t": 261.66666666666674, "r": 373.6666666666667, "b": 268.66666666666674, "coord_origin": "1"}}, {"id": 481, "text": "specific", "bbox": {"l": 378.0, "t": 259.33333333333326, "r": 407.6666666666667, "b": 268.66666666666674, "coord_origin": "1"}}, {"id": 482, "text": "appearances", "bbox": {"l": 412.0, "t": 261.66666666666674, "r": 460.0, "b": 268.66666666666674, "coord_origin": "1"}}, {"id": 483, "text": "(e.g.", "bbox": {"l": 464.3333333333333, "t": 260.0, "r": 481.0, "b": 268.66666666666674, "coord_origin": "1"}}, {"id": 484, "text": "financial", "bbox": {"l": 488.6666666666667, "t": 259.33333333333326, "r": 522.0, "b": 266.33333333333326, "coord_origin": "1"}}, {"id": 485, "text": "data,", "bbox": {"l": 526.0, "t": 259.33333333333326, "r": 544.3333333333334, "b": 267.0, "coord_origin": "1"}}, {"id": 486, "text": "marketing", "bbox": {"l": 309.0, "t": 271.33333333333326, "r": 349.0, "b": 280.6666666666667, "coord_origin": "1"}}, {"id": 487, "text": "data,", "bbox": {"l": 353.0, "t": 271.33333333333326, "r": 371.3333333333333, "b": 279.33333333333326, "coord_origin": "1"}}, {"id": 488, "text": "etc.)", "bbox": {"l": 376.0, "t": 271.66666666666674, "r": 393.0, "b": 279.66666666666674, "coord_origin": "1"}}, {"id": 489, "text": "Additionally,", "bbox": {"l": 400.3333333333333, "t": 271.33333333333326, "r": 451.6666666666667, "b": 280.6666666666667, "coord_origin": "1"}}, {"id": 490, "text": "we", "bbox": {"l": 456.6666666666667, "t": 273.66666666666674, "r": 467.6666666666667, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 491, "text": "have", "bbox": {"l": 472.0, "t": 271.33333333333326, "r": 489.6666666666667, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 492, "text": "prepared", "bbox": {"l": 494.0, "t": 271.33333333333326, "r": 528.3333333333334, "b": 280.6666666666667, "coord_origin": "1"}}, {"id": 493, "text": "cu-", "bbox": {"l": 532.3333333333334, "t": 273.66666666666674, "r": 544.6666666666666, "b": 278.33333333333326, "coord_origin": "1"}}, {"id": 494, "text": "rated", "bbox": {"l": 309.0, "t": 283.3333333333333, "r": 328.3333333333333, "b": 290.3333333333333, "coord_origin": "1"}}, {"id": 495, "text": "collections", "bbox": {"l": 331.0, "t": 283.3333333333333, "r": 373.6666666666667, "b": 290.3333333333333, "coord_origin": "1"}}, {"id": 496, "text": "of", "bbox": {"l": 376.3333333333333, "t": 283.3333333333333, "r": 384.6666666666667, "b": 290.3333333333333, "coord_origin": "1"}}, {"id": 497, "text": "content", "bbox": {"l": 386.3333333333333, "t": 284.6666666666667, "r": 415.3333333333333, "b": 290.3333333333333, "coord_origin": "1"}}, {"id": 498, "text": "templates", "bbox": {"l": 418.0, "t": 283.3333333333333, "r": 455.6666666666667, "b": 292.6666666666667, "coord_origin": "1"}}, {"id": 499, "text": "by", "bbox": {"l": 458.0, "t": 283.3333333333333, "r": 467.3333333333333, "b": 292.6666666666667, "coord_origin": "1"}}, {"id": 500, "text": "extracting", "bbox": {"l": 470.0, "t": 283.3333333333333, "r": 509.3333333333333, "b": 292.6666666666667, "coord_origin": "1"}}, {"id": 501, "text": "the", "bbox": {"l": 511.6666666666667, "t": 283.3333333333333, "r": 523.3333333333334, "b": 290.3333333333333, "coord_origin": "1"}}, {"id": 502, "text": "most", "bbox": {"l": 526.0, "t": 284.6666666666667, "r": 544.6666666666666, "b": 290.3333333333333, "coord_origin": "1"}}, {"id": 503, "text": "frequently", "bbox": {"l": 309.3333333333333, "t": 295.3333333333333, "r": 349.3333333333333, "b": 304.6666666666667, "coord_origin": "1"}}, {"id": 504, "text": "used", "bbox": {"l": 354.6666666666667, "t": 295.3333333333333, "r": 372.0, "b": 302.3333333333333, "coord_origin": "1"}}, {"id": 505, "text": "terms", "bbox": {"l": 377.0, "t": 296.6666666666667, "r": 398.3333333333333, "b": 302.3333333333333, "coord_origin": "1"}}, {"id": 506, "text": "out", "bbox": {"l": 403.3333333333333, "t": 296.6666666666667, "r": 415.6666666666667, "b": 302.3333333333333, "coord_origin": "1"}}, {"id": 507, "text": "of", "bbox": {"l": 420.3333333333333, "t": 295.3333333333333, "r": 429.0, "b": 302.3333333333333, "coord_origin": "1"}}, {"id": 508, "text": "non-synthetic", "bbox": {"l": 433.0, "t": 295.3333333333333, "r": 486.6666666666667, "b": 304.6666666666667, "coord_origin": "1"}}, {"id": 509, "text": "datasets", "bbox": {"l": 491.6666666666667, "t": 295.3333333333333, "r": 522.6666666666666, "b": 302.3333333333333, "coord_origin": "1"}}, {"id": 510, "text": "(e.g.", "bbox": {"l": 527.6666666666666, "t": 295.6666666666667, "r": 544.3333333333334, "b": 304.6666666666667, "coord_origin": "1"}}, {"id": 511, "text": "PubTabNet,", "bbox": {"l": 309.0, "t": 307.0, "r": 355.3333333333333, "b": 314.6666666666667, "coord_origin": "1"}}, {"id": 512, "text": "FinTabNet,", "bbox": {"l": 358.6666666666667, "t": 307.0, "r": 402.6666666666667, "b": 314.6666666666667, "coord_origin": "1"}}, {"id": 513, "text": "etc.).", "bbox": {"l": 406.0, "t": 307.6666666666667, "r": 425.0, "b": 315.3333333333333, "coord_origin": "1"}}]}, "text": "1. Prepare styling and content templates: The styling templates have been manually designed and organized into groups of scope specific appearances (e.g. financial data, marketing data, etc.) Additionally, we have prepared curated collections of content templates by extracting the most frequently used terms out of non-synthetic datasets (e.g. PubTabNet, FinTabNet, etc.)."}, {"label": "Text", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "Text", "bbox": {"l": 308.2052001953125, "t": 319.20440673828125, "r": 545.3333333333334, "b": 448.723388671875, "coord_origin": "1"}, "confidence": 0.9882545471191406, "cells": [{"id": 514, "text": "2.", "bbox": {"l": 321.0, "t": 320.0, "r": 327.3333333333333, "b": 327.0, "coord_origin": "1"}}, {"id": 515, "text": "Generate", "bbox": {"l": 333.0, "t": 320.0, "r": 368.3333333333333, "b": 327.0, "coord_origin": "1"}}, {"id": 516, "text": "table", "bbox": {"l": 372.0, "t": 320.0, "r": 390.6666666666667, "b": 327.0, "coord_origin": "1"}}, {"id": 517, "text": "structures:", "bbox": {"l": 394.3333333333333, "t": 321.0, "r": 434.3333333333333, "b": 327.0, "coord_origin": "1"}}, {"id": 518, "text": "The", "bbox": {"l": 439.3333333333333, "t": 320.0, "r": 454.3333333333333, "b": 327.0, "coord_origin": "1"}}, {"id": 519, "text": "structure", "bbox": {"l": 458.0, "t": 321.3333333333333, "r": 492.3333333333333, "b": 327.0, "coord_origin": "1"}}, {"id": 520, "text": "of", "bbox": {"l": 495.6666666666667, "t": 320.0, "r": 504.3333333333333, "b": 327.0, "coord_origin": "1"}}, {"id": 521, "text": "each", "bbox": {"l": 507.0, "t": 320.0, "r": 524.6666666666666, "b": 327.0, "coord_origin": "1"}}, {"id": 522, "text": "syn-", "bbox": {"l": 528.3333333333334, "t": 322.0, "r": 544.6666666666666, "b": 329.0, "coord_origin": "1"}}, {"id": 523, "text": "thetic", "bbox": {"l": 309.0, "t": 332.0, "r": 330.6666666666667, "b": 339.0, "coord_origin": "1"}}, {"id": 524, "text": "dataset", "bbox": {"l": 334.3333333333333, "t": 332.0, "r": 361.3333333333333, "b": 339.0, "coord_origin": "1"}}, {"id": 525, "text": "assumes", "bbox": {"l": 365.0, "t": 334.0, "r": 397.6666666666667, "b": 339.0, "coord_origin": "1"}}, {"id": 526, "text": "a", "bbox": {"l": 401.3333333333333, "t": 334.0, "r": 405.3333333333333, "b": 339.0, "coord_origin": "1"}}, {"id": 527, "text": "horizontal", "bbox": {"l": 409.0, "t": 332.0, "r": 448.6666666666667, "b": 339.0, "coord_origin": "1"}}, {"id": 528, "text": "table", "bbox": {"l": 452.6666666666667, "t": 332.0, "r": 471.3333333333333, "b": 339.0, "coord_origin": "1"}}, {"id": 529, "text": "header", "bbox": {"l": 475.0, "t": 332.0, "r": 501.3333333333333, "b": 339.0, "coord_origin": "1"}}, {"id": 530, "text": "which", "bbox": {"l": 504.6666666666667, "t": 332.0, "r": 528.3333333333334, "b": 339.0, "coord_origin": "1"}}, {"id": 531, "text": "po-", "bbox": {"l": 532.0, "t": 334.0, "r": 544.6666666666666, "b": 341.0, "coord_origin": "1"}}, {"id": 532, "text": "tentially", "bbox": {"l": 309.0, "t": 344.0, "r": 341.0, "b": 353.0, "coord_origin": "1"}}, {"id": 533, "text": "spans", "bbox": {"l": 346.0, "t": 346.0, "r": 367.6666666666667, "b": 353.0, "coord_origin": "1"}}, {"id": 534, "text": "over", "bbox": {"l": 372.3333333333333, "t": 346.0, "r": 389.6666666666667, "b": 351.0, "coord_origin": "1"}}, {"id": 535, "text": "multiple", "bbox": {"l": 394.3333333333333, "t": 344.0, "r": 426.6666666666667, "b": 353.0, "coord_origin": "1"}}, {"id": 536, "text": "rows", "bbox": {"l": 431.6666666666667, "t": 346.0, "r": 450.3333333333333, "b": 351.0, "coord_origin": "1"}}, {"id": 537, "text": "and", "bbox": {"l": 455.0, "t": 344.0, "r": 468.6666666666667, "b": 351.0, "coord_origin": "1"}}, {"id": 538, "text": "a", "bbox": {"l": 473.6666666666667, "t": 346.0, "r": 477.6666666666667, "b": 351.0, "coord_origin": "1"}}, {"id": 539, "text": "table", "bbox": {"l": 482.6666666666667, "t": 344.0, "r": 501.3333333333333, "b": 351.0, "coord_origin": "1"}}, {"id": 540, "text": "body", "bbox": {"l": 506.3333333333333, "t": 344.0, "r": 525.3333333333334, "b": 353.0, "coord_origin": "1"}}, {"id": 541, "text": "that", "bbox": {"l": 530.6666666666666, "t": 344.0, "r": 544.6666666666666, "b": 351.0, "coord_origin": "1"}}, {"id": 542, "text": "may", "bbox": {"l": 309.0, "t": 358.0, "r": 325.6666666666667, "b": 365.0, "coord_origin": "1"}}, {"id": 543, "text": "contain", "bbox": {"l": 328.3333333333333, "t": 356.0, "r": 357.3333333333333, "b": 363.0, "coord_origin": "1"}}, {"id": 544, "text": "a", "bbox": {"l": 360.3333333333333, "t": 358.0, "r": 364.3333333333333, "b": 363.0, "coord_origin": "1"}}, {"id": 545, "text": "combination", "bbox": {"l": 367.0, "t": 356.0, "r": 416.0, "b": 363.0, "coord_origin": "1"}}, {"id": 546, "text": "of", "bbox": {"l": 419.0, "t": 356.0, "r": 427.6666666666667, "b": 363.0, "coord_origin": "1"}}, {"id": 547, "text": "row", "bbox": {"l": 429.6666666666667, "t": 358.0, "r": 444.3333333333333, "b": 363.0, "coord_origin": "1"}}, {"id": 548, "text": "spans", "bbox": {"l": 447.3333333333333, "t": 358.0, "r": 468.6666666666667, "b": 365.0, "coord_origin": "1"}}, {"id": 549, "text": "and", "bbox": {"l": 471.6666666666667, "t": 356.0, "r": 485.3333333333333, "b": 363.0, "coord_origin": "1"}}, {"id": 550, "text": "column", "bbox": {"l": 488.3333333333333, "t": 356.0, "r": 517.6666666666666, "b": 363.0, "coord_origin": "1"}}, {"id": 551, "text": "spans.", "bbox": {"l": 520.6666666666666, "t": 358.0, "r": 544.3333333333334, "b": 365.0, "coord_origin": "1"}}, {"id": 552, "text": "However,", "bbox": {"l": 309.3333333333333, "t": 368.0, "r": 346.3333333333333, "b": 375.6666666666667, "coord_origin": "1"}}, {"id": 553, "text": "spans", "bbox": {"l": 350.3333333333333, "t": 370.0, "r": 371.6666666666667, "b": 377.0, "coord_origin": "1"}}, {"id": 554, "text": "are", "bbox": {"l": 375.3333333333333, "t": 370.0, "r": 386.6666666666667, "b": 375.0, "coord_origin": "1"}}, {"id": 555, "text": "not", "bbox": {"l": 390.3333333333333, "t": 369.0, "r": 402.6666666666667, "b": 375.0, "coord_origin": "1"}}, {"id": 556, "text": "allowed", "bbox": {"l": 406.0, "t": 368.0, "r": 436.6666666666667, "b": 375.0, "coord_origin": "1"}}, {"id": 557, "text": "to", "bbox": {"l": 440.3333333333333, "t": 369.3333333333333, "r": 447.6666666666667, "b": 375.0, "coord_origin": "1"}}, {"id": 558, "text": "cross", "bbox": {"l": 451.0, "t": 370.0, "r": 471.0, "b": 375.0, "coord_origin": "1"}}, {"id": 559, "text": "the", "bbox": {"l": 474.6666666666667, "t": 368.0, "r": 486.0, "b": 375.0, "coord_origin": "1"}}, {"id": 560, "text": "header", "bbox": {"l": 489.6666666666667, "t": 368.0, "r": 516.0, "b": 375.0, "coord_origin": "1"}}, {"id": 561, "text": "-", "bbox": {"l": 519.3333333333334, "t": 372.0, "r": 521.6666666666666, "b": 373.0, "coord_origin": "1"}}, {"id": 562, "text": "body", "bbox": {"l": 525.3333333333334, "t": 368.0, "r": 544.6666666666666, "b": 377.0, "coord_origin": "1"}}, {"id": 563, "text": "boundary.", "bbox": {"l": 309.0, "t": 380.0, "r": 347.6666666666667, "b": 389.0, "coord_origin": "1"}}, {"id": 564, "text": "The", "bbox": {"l": 353.6666666666667, "t": 380.0, "r": 368.6666666666667, "b": 387.0, "coord_origin": "1"}}, {"id": 565, "text": "table", "bbox": {"l": 372.3333333333333, "t": 380.0, "r": 391.3333333333333, "b": 387.0, "coord_origin": "1"}}, {"id": 566, "text": "structure", "bbox": {"l": 395.0, "t": 381.3333333333333, "r": 429.3333333333333, "b": 387.0, "coord_origin": "1"}}, {"id": 567, "text": "is", "bbox": {"l": 433.0, "t": 380.0, "r": 439.0, "b": 387.0, "coord_origin": "1"}}, {"id": 568, "text": "described", "bbox": {"l": 442.6666666666667, "t": 380.0, "r": 480.3333333333333, "b": 387.0, "coord_origin": "1"}}, {"id": 569, "text": "by", "bbox": {"l": 484.3333333333333, "t": 380.0, "r": 493.3333333333333, "b": 389.0, "coord_origin": "1"}}, {"id": 570, "text": "the", "bbox": {"l": 497.3333333333333, "t": 380.0, "r": 509.0, "b": 387.0, "coord_origin": "1"}}, {"id": 571, "text": "parame-", "bbox": {"l": 512.6666666666666, "t": 382.0, "r": 544.6666666666666, "b": 389.0, "coord_origin": "1"}}, {"id": 572, "text": "ters:", "bbox": {"l": 309.0, "t": 392.6666666666667, "r": 325.0, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 573, "text": "Total", "bbox": {"l": 331.0, "t": 391.6666666666667, "r": 350.6666666666667, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 574, "text": "number", "bbox": {"l": 354.6666666666667, "t": 391.6666666666667, "r": 385.0, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 575, "text": "of", "bbox": {"l": 388.6666666666667, "t": 391.3333333333333, "r": 397.0, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 576, "text": "table", "bbox": {"l": 400.3333333333333, "t": 391.6666666666667, "r": 419.0, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 577, "text": "rows", "bbox": {"l": 423.0, "t": 393.6666666666667, "r": 441.6666666666667, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 578, "text": "and", "bbox": {"l": 445.6666666666667, "t": 391.3333333333333, "r": 459.3333333333333, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 579, "text": "columns,", "bbox": {"l": 463.3333333333333, "t": 391.3333333333333, "r": 498.6666666666667, "b": 399.0, "coord_origin": "1"}}, {"id": 580, "text": "number", "bbox": {"l": 503.3333333333333, "t": 391.3333333333333, "r": 533.3333333333334, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 581, "text": "of", "bbox": {"l": 537.0, "t": 391.3333333333333, "r": 545.3333333333334, "b": 398.3333333333333, "coord_origin": "1"}}, {"id": 582, "text": "header", "bbox": {"l": 309.0, "t": 403.3333333333333, "r": 335.3333333333333, "b": 410.3333333333333, "coord_origin": "1"}}, {"id": 583, "text": "rows,", "bbox": {"l": 339.3333333333333, "t": 405.6666666666667, "r": 360.3333333333333, "b": 411.3333333333333, "coord_origin": "1"}}, {"id": 584, "text": "type", "bbox": {"l": 365.3333333333333, "t": 404.6666666666667, "r": 381.6666666666667, "b": 412.6666666666667, "coord_origin": "1"}}, {"id": 585, "text": "of", "bbox": {"l": 386.3333333333333, "t": 403.3333333333333, "r": 394.6666666666667, "b": 410.3333333333333, "coord_origin": "1"}}, {"id": 586, "text": "spans", "bbox": {"l": 398.6666666666667, "t": 405.6666666666667, "r": 420.0, "b": 412.6666666666667, "coord_origin": "1"}}, {"id": 587, "text": "(header", "bbox": {"l": 424.6666666666667, "t": 403.3333333333333, "r": 454.0, "b": 411.6666666666667, "coord_origin": "1"}}, {"id": 588, "text": "only", "bbox": {"l": 458.0, "t": 403.6666666666667, "r": 475.3333333333333, "b": 412.6666666666667, "coord_origin": "1"}}, {"id": 589, "text": "spans,", "bbox": {"l": 480.0, "t": 405.6666666666667, "r": 503.6666666666667, "b": 412.6666666666667, "coord_origin": "1"}}, {"id": 590, "text": "row", "bbox": {"l": 508.3333333333333, "t": 405.6666666666667, "r": 523.0, "b": 410.3333333333333, "coord_origin": "1"}}, {"id": 591, "text": "only", "bbox": {"l": 527.6666666666666, "t": 403.6666666666667, "r": 544.6666666666666, "b": 412.6666666666667, "coord_origin": "1"}}, {"id": 592, "text": "spans,", "bbox": {"l": 309.0, "t": 417.6666666666667, "r": 333.0, "b": 424.6666666666667, "coord_origin": "1"}}, {"id": 593, "text": "column", "bbox": {"l": 338.3333333333333, "t": 415.6666666666667, "r": 367.3333333333333, "b": 422.3333333333333, "coord_origin": "1"}}, {"id": 594, "text": "only", "bbox": {"l": 372.3333333333333, "t": 415.6666666666667, "r": 389.3333333333333, "b": 424.6666666666667, "coord_origin": "1"}}, {"id": 595, "text": "spans,", "bbox": {"l": 394.3333333333333, "t": 417.6666666666667, "r": 418.0, "b": 424.6666666666667, "coord_origin": "1"}}, {"id": 596, "text": "both", "bbox": {"l": 423.6666666666667, "t": 415.6666666666667, "r": 440.6666666666667, "b": 422.3333333333333, "coord_origin": "1"}}, {"id": 597, "text": "row", "bbox": {"l": 445.3333333333333, "t": 417.6666666666667, "r": 460.0, "b": 422.3333333333333, "coord_origin": "1"}}, {"id": 598, "text": "and", "bbox": {"l": 464.6666666666667, "t": 415.6666666666667, "r": 478.3333333333333, "b": 422.3333333333333, "coord_origin": "1"}}, {"id": 599, "text": "column", "bbox": {"l": 483.3333333333333, "t": 415.6666666666667, "r": 512.6666666666666, "b": 422.3333333333333, "coord_origin": "1"}}, {"id": 600, "text": "spans),", "bbox": {"l": 517.3333333333334, "t": 415.6666666666667, "r": 544.3333333333334, "b": 424.6666666666667, "coord_origin": "1"}}, {"id": 601, "text": "maximum", "bbox": {"l": 309.0, "t": 427.3333333333333, "r": 348.6666666666667, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 602, "text": "span", "bbox": {"l": 352.6666666666667, "t": 429.6666666666667, "r": 370.0, "b": 436.6666666666667, "coord_origin": "1"}}, {"id": 603, "text": "size", "bbox": {"l": 374.0, "t": 427.3333333333333, "r": 388.6666666666667, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 604, "text": "and", "bbox": {"l": 392.0, "t": 427.6666666666667, "r": 406.0, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 605, "text": "the", "bbox": {"l": 409.6666666666667, "t": 427.6666666666667, "r": 421.0, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 606, "text": "ratio", "bbox": {"l": 424.6666666666667, "t": 427.3333333333333, "r": 442.3333333333333, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 607, "text": "of", "bbox": {"l": 445.6666666666667, "t": 427.3333333333333, "r": 454.3333333333333, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 608, "text": "the", "bbox": {"l": 457.3333333333333, "t": 427.6666666666667, "r": 468.6666666666667, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 609, "text": "table", "bbox": {"l": 472.3333333333333, "t": 427.6666666666667, "r": 491.0, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 610, "text": "area", "bbox": {"l": 494.6666666666667, "t": 429.6666666666667, "r": 510.6666666666667, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 611, "text": "covered", "bbox": {"l": 514.0, "t": 427.6666666666667, "r": 544.6666666666666, "b": 434.3333333333333, "coord_origin": "1"}}, {"id": 612, "text": "by", "bbox": {"l": 309.0, "t": 439.6666666666667, "r": 318.3333333333333, "b": 448.6666666666667, "coord_origin": "1"}}, {"id": 613, "text": "spans.", "bbox": {"l": 321.6666666666667, "t": 441.6666666666667, "r": 345.3333333333333, "b": 448.6666666666667, "coord_origin": "1"}}]}, "text": "2. Generate table structures: The structure of each synthetic dataset assumes a horizontal table header which potentially spans over multiple rows and a table body that may contain a combination of row spans and column spans. However, spans are not allowed to cross the header -body boundary. The table structure is described by the parameters: Total number of table rows and columns, number of header rows, type of spans (header only spans, row only spans, column only spans, both row and column spans), maximum span size and the ratio of the table area covered by spans."}, {"label": "Text", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "Text", "bbox": {"l": 308.17218017578125, "t": 451.7388000488281, "r": 545.3333333333334, "b": 497.0, "coord_origin": "1"}, "confidence": 0.9816291332244873, "cells": [{"id": 614, "text": "3.", "bbox": {"l": 321.0, "t": 452.3333333333333, "r": 327.3333333333333, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 615, "text": "Generate", "bbox": {"l": 331.3333333333333, "t": 452.3333333333333, "r": 366.6666666666667, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 616, "text": "content:", "bbox": {"l": 369.6666666666667, "t": 453.6666666666667, "r": 401.0, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 617, "text": "Based", "bbox": {"l": 405.0, "t": 452.3333333333333, "r": 428.6666666666667, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 618, "text": "on", "bbox": {"l": 431.3333333333333, "t": 454.6666666666667, "r": 441.0, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 619, "text": "the", "bbox": {"l": 444.0, "t": 452.3333333333333, "r": 455.3333333333333, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 620, "text": "dataset", "bbox": {"l": 458.3333333333333, "t": 452.3333333333333, "r": 485.3333333333333, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 621, "text": "theme,", "bbox": {"l": 488.3333333333333, "t": 452.3333333333333, "r": 513.6666666666666, "b": 460.3333333333333, "coord_origin": "1"}}, {"id": 622, "text": "a", "bbox": {"l": 517.0, "t": 454.6666666666667, "r": 521.0, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 623, "text": "set", "bbox": {"l": 523.6666666666666, "t": 453.6666666666667, "r": 534.0, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 624, "text": "of", "bbox": {"l": 537.0, "t": 452.3333333333333, "r": 545.3333333333334, "b": 459.3333333333333, "coord_origin": "1"}}, {"id": 625, "text": "suitable", "bbox": {"l": 309.0, "t": 464.0, "r": 339.3333333333333, "b": 471.0, "coord_origin": "1"}}, {"id": 626, "text": "content", "bbox": {"l": 342.3333333333333, "t": 465.3333333333333, "r": 371.0, "b": 471.0, "coord_origin": "1"}}, {"id": 627, "text": "templates", "bbox": {"l": 374.0, "t": 464.0, "r": 411.3333333333333, "b": 473.0, "coord_origin": "1"}}, {"id": 628, "text": "is", "bbox": {"l": 414.3333333333333, "t": 464.0, "r": 420.3333333333333, "b": 471.0, "coord_origin": "1"}}, {"id": 629, "text": "chosen", "bbox": {"l": 423.0, "t": 464.0, "r": 450.3333333333333, "b": 471.0, "coord_origin": "1"}}, {"id": 630, "text": "first.", "bbox": {"l": 453.3333333333333, "t": 464.0, "r": 470.0, "b": 471.0, "coord_origin": "1"}}, {"id": 631, "text": "Then,", "bbox": {"l": 474.0, "t": 464.0, "r": 496.3333333333333, "b": 471.6666666666667, "coord_origin": "1"}}, {"id": 632, "text": "this", "bbox": {"l": 499.3333333333333, "t": 464.0, "r": 513.3333333333334, "b": 471.0, "coord_origin": "1"}}, {"id": 633, "text": "content", "bbox": {"l": 516.0, "t": 465.3333333333333, "r": 544.6666666666666, "b": 471.0, "coord_origin": "1"}}, {"id": 634, "text": "can", "bbox": {"l": 309.0, "t": 478.0, "r": 322.3333333333333, "b": 483.0, "coord_origin": "1"}}, {"id": 635, "text": "be", "bbox": {"l": 326.6666666666667, "t": 476.0, "r": 335.3333333333333, "b": 483.0, "coord_origin": "1"}}, {"id": 636, "text": "combined", "bbox": {"l": 339.6666666666667, "t": 476.0, "r": 378.3333333333333, "b": 483.0, "coord_origin": "1"}}, {"id": 637, "text": "with", "bbox": {"l": 383.0, "t": 476.0, "r": 400.0, "b": 483.0, "coord_origin": "1"}}, {"id": 638, "text": "purely", "bbox": {"l": 404.0, "t": 476.0, "r": 428.6666666666667, "b": 485.0, "coord_origin": "1"}}, {"id": 639, "text": "random", "bbox": {"l": 433.3333333333333, "t": 476.0, "r": 463.0, "b": 483.0, "coord_origin": "1"}}, {"id": 640, "text": "text", "bbox": {"l": 467.3333333333333, "t": 477.3333333333333, "r": 481.6666666666667, "b": 483.0, "coord_origin": "1"}}, {"id": 641, "text": "to", "bbox": {"l": 486.0, "t": 477.3333333333333, "r": 493.0, "b": 483.0, "coord_origin": "1"}}, {"id": 642, "text": "produce", "bbox": {"l": 497.3333333333333, "t": 476.0, "r": 528.6666666666666, "b": 485.0, "coord_origin": "1"}}, {"id": 643, "text": "the", "bbox": {"l": 533.3333333333334, "t": 476.0, "r": 544.6666666666666, "b": 483.0, "coord_origin": "1"}}, {"id": 644, "text": "synthetic", "bbox": {"l": 309.0, "t": 488.0, "r": 344.3333333333333, "b": 497.0, "coord_origin": "1"}}, {"id": 645, "text": "content.", "bbox": {"l": 347.3333333333333, "t": 489.0, "r": 378.3333333333333, "b": 495.0, "coord_origin": "1"}}]}, "text": "3. Generate content: Based on the dataset theme, a set of suitable content templates is chosen first. Then, this content can be combined with purely random text to produce the synthetic content."}, {"label": "Text", "id": 13, "page_no": 0, "cluster": {"id": 13, "label": "Text", "bbox": {"l": 308.402587890625, "t": 500.48095703125, "r": 545.0632934570312, "b": 545.6666666666666, "coord_origin": "1"}, "confidence": 0.9804794788360596, "cells": [{"id": 646, "text": "4.", "bbox": {"l": 320.6666666666667, "t": 501.0, "r": 327.3333333333333, "b": 508.0, "coord_origin": "1"}}, {"id": 647, "text": "Apply", "bbox": {"l": 334.3333333333333, "t": 501.0, "r": 358.6666666666667, "b": 510.0, "coord_origin": "1"}}, {"id": 648, "text": "styling", "bbox": {"l": 363.0, "t": 501.0, "r": 389.3333333333333, "b": 510.0, "coord_origin": "1"}}, {"id": 649, "text": "templates:", "bbox": {"l": 393.3333333333333, "t": 501.0, "r": 433.3333333333333, "b": 510.0, "coord_origin": "1"}}, {"id": 650, "text": "Depending", "bbox": {"l": 439.3333333333333, "t": 501.0, "r": 482.3333333333333, "b": 510.0, "coord_origin": "1"}}, {"id": 651, "text": "on", "bbox": {"l": 486.3333333333333, "t": 503.0, "r": 495.6666666666667, "b": 508.0, "coord_origin": "1"}}, {"id": 652, "text": "the", "bbox": {"l": 500.0, "t": 501.0, "r": 511.3333333333333, "b": 508.0, "coord_origin": "1"}}, {"id": 653, "text": "domain", "bbox": {"l": 515.3333333333334, "t": 501.0, "r": 544.6666666666666, "b": 508.0, "coord_origin": "1"}}, {"id": 654, "text": "of", "bbox": {"l": 309.0, "t": 513.0, "r": 317.6666666666667, "b": 520.0, "coord_origin": "1"}}, {"id": 655, "text": "the", "bbox": {"l": 321.3333333333333, "t": 513.0, "r": 332.6666666666667, "b": 520.0, "coord_origin": "1"}}, {"id": 656, "text": "synthetic", "bbox": {"l": 337.3333333333333, "t": 513.0, "r": 372.3333333333333, "b": 522.0, "coord_origin": "1"}}, {"id": 657, "text": "dataset,", "bbox": {"l": 376.6666666666667, "t": 513.0, "r": 406.3333333333333, "b": 520.6666666666666, "coord_origin": "1"}}, {"id": 658, "text": "a", "bbox": {"l": 411.3333333333333, "t": 515.0, "r": 415.3333333333333, "b": 520.0, "coord_origin": "1"}}, {"id": 659, "text": "set", "bbox": {"l": 419.6666666666667, "t": 514.0, "r": 430.0, "b": 520.0, "coord_origin": "1"}}, {"id": 660, "text": "of", "bbox": {"l": 434.3333333333333, "t": 513.0, "r": 443.0, "b": 520.0, "coord_origin": "1"}}, {"id": 661, "text": "styling", "bbox": {"l": 446.6666666666667, "t": 513.0, "r": 473.0, "b": 522.0, "coord_origin": "1"}}, {"id": 662, "text": "templates", "bbox": {"l": 477.3333333333333, "t": 513.0, "r": 515.0, "b": 522.0, "coord_origin": "1"}}, {"id": 663, "text": "is", "bbox": {"l": 519.6666666666666, "t": 513.0, "r": 525.3333333333334, "b": 520.0, "coord_origin": "1"}}, {"id": 664, "text": "first", "bbox": {"l": 530.0, "t": 513.0, "r": 544.6666666666666, "b": 520.0, "coord_origin": "1"}}, {"id": 665, "text": "manually", "bbox": {"l": 309.0, "t": 525.0, "r": 345.3333333333333, "b": 534.0, "coord_origin": "1"}}, {"id": 666, "text": "selected.", "bbox": {"l": 350.0, "t": 525.0, "r": 383.6666666666667, "b": 532.0, "coord_origin": "1"}}, {"id": 667, "text": "Then,", "bbox": {"l": 391.3333333333333, "t": 525.0, "r": 413.6666666666667, "b": 532.6666666666666, "coord_origin": "1"}}, {"id": 668, "text": "a", "bbox": {"l": 418.3333333333333, "t": 527.0, "r": 422.3333333333333, "b": 532.0, "coord_origin": "1"}}, {"id": 669, "text": "style", "bbox": {"l": 427.0, "t": 525.0, "r": 445.0, "b": 534.0, "coord_origin": "1"}}, {"id": 670, "text": "is", "bbox": {"l": 449.3333333333333, "t": 525.0, "r": 455.3333333333333, "b": 532.0, "coord_origin": "1"}}, {"id": 671, "text": "randomly", "bbox": {"l": 459.6666666666667, "t": 525.0, "r": 497.3333333333333, "b": 534.0, "coord_origin": "1"}}, {"id": 672, "text": "selected", "bbox": {"l": 502.0, "t": 525.0, "r": 533.3333333333334, "b": 532.0, "coord_origin": "1"}}, {"id": 673, "text": "to", "bbox": {"l": 537.6666666666666, "t": 526.0, "r": 545.0, "b": 532.0, "coord_origin": "1"}}, {"id": 674, "text": "format", "bbox": {"l": 309.3333333333333, "t": 536.3333333333334, "r": 335.0, "b": 543.3333333333334, "coord_origin": "1"}}, {"id": 675, "text": "the", "bbox": {"l": 338.0, "t": 536.3333333333334, "r": 349.6666666666667, "b": 543.3333333333334, "coord_origin": "1"}}, {"id": 676, "text": "appearance", "bbox": {"l": 352.6666666666667, "t": 538.6666666666666, "r": 397.0, "b": 545.6666666666666, "coord_origin": "1"}}, {"id": 677, "text": "of", "bbox": {"l": 400.0, "t": 536.3333333333334, "r": 408.6666666666667, "b": 543.3333333333334, "coord_origin": "1"}}, {"id": 678, "text": "the", "bbox": {"l": 411.0, "t": 536.6666666666666, "r": 422.3333333333333, "b": 543.3333333333334, "coord_origin": "1"}}, {"id": 679, "text": "synthesized", "bbox": {"l": 425.6666666666667, "t": 536.3333333333334, "r": 471.3333333333333, "b": 545.6666666666666, "coord_origin": "1"}}, {"id": 680, "text": "table.", "bbox": {"l": 474.6666666666667, "t": 536.3333333333334, "r": 495.3333333333333, "b": 543.3333333333334, "coord_origin": "1"}}]}, "text": "4. Apply styling templates: Depending on the domain of the synthetic dataset, a set of styling templates is first manually selected. Then, a style is randomly selected to format the appearance of the synthesized table."}, {"label": "Text", "id": 14, "page_no": 0, "cluster": {"id": 14, "label": "Text", "bbox": {"l": 308.32305908203125, "t": 548.5647583007812, "r": 545.078857421875, "b": 606.7564697265625, "coord_origin": "1"}, "confidence": 0.9807284474372864, "cells": [{"id": 681, "text": "5.", "bbox": {"l": 321.0, "t": 549.3333333333334, "r": 327.3333333333333, "b": 556.3333333333334, "coord_origin": "1"}}, {"id": 682, "text": "Render", "bbox": {"l": 335.6666666666667, "t": 549.3333333333334, "r": 364.3333333333333, "b": 556.3333333333334, "coord_origin": "1"}}, {"id": 683, "text": "the", "bbox": {"l": 368.3333333333333, "t": 549.3333333333334, "r": 379.6666666666667, "b": 556.3333333333334, "coord_origin": "1"}}, {"id": 684, "text": "complete", "bbox": {"l": 384.0, "t": 549.3333333333334, "r": 420.0, "b": 558.6666666666666, "coord_origin": "1"}}, {"id": 685, "text": "tables:", "bbox": {"l": 424.6666666666667, "t": 549.3333333333334, "r": 449.6666666666667, "b": 556.3333333333334, "coord_origin": "1"}}, {"id": 686, "text": "The", "bbox": {"l": 456.3333333333333, "t": 549.3333333333334, "r": 471.3333333333333, "b": 556.3333333333334, "coord_origin": "1"}}, {"id": 687, "text": "synthetic", "bbox": {"l": 475.6666666666667, "t": 549.3333333333334, "r": 511.0, "b": 558.3333333333334, "coord_origin": "1"}}, {"id": 688, "text": "table", "bbox": {"l": 515.3333333333334, "t": 549.3333333333334, "r": 534.3333333333334, "b": 556.3333333333334, "coord_origin": "1"}}, {"id": 689, "text": "is", "bbox": {"l": 538.6666666666666, "t": 549.3333333333334, "r": 544.6666666666666, "b": 556.3333333333334, "coord_origin": "1"}}, {"id": 690, "text": "finally", "bbox": {"l": 309.3333333333333, "t": 561.3333333333334, "r": 333.6666666666667, "b": 570.6666666666666, "coord_origin": "1"}}, {"id": 691, "text": "rendered", "bbox": {"l": 338.0, "t": 561.3333333333334, "r": 372.3333333333333, "b": 568.3333333333334, "coord_origin": "1"}}, {"id": 692, "text": "by", "bbox": {"l": 376.6666666666667, "t": 561.3333333333334, "r": 386.0, "b": 570.6666666666666, "coord_origin": "1"}}, {"id": 693, "text": "a", "bbox": {"l": 390.3333333333333, "t": 563.6666666666666, "r": 394.3333333333333, "b": 568.3333333333334, "coord_origin": "1"}}, {"id": 694, "text": "web", "bbox": {"l": 398.6666666666667, "t": 561.3333333333334, "r": 414.3333333333333, "b": 568.3333333333334, "coord_origin": "1"}}, {"id": 695, "text": "browser", "bbox": {"l": 418.6666666666667, "t": 561.3333333333334, "r": 450.3333333333333, "b": 568.3333333333334, "coord_origin": "1"}}, {"id": 696, "text": "engine", "bbox": {"l": 454.0, "t": 561.3333333333334, "r": 480.0, "b": 570.6666666666666, "coord_origin": "1"}}, {"id": 697, "text": "to", "bbox": {"l": 484.3333333333333, "t": 562.6666666666666, "r": 491.6666666666667, "b": 568.3333333333334, "coord_origin": "1"}}, {"id": 698, "text": "generate", "bbox": {"l": 495.6666666666667, "t": 562.6666666666666, "r": 529.0, "b": 570.6666666666666, "coord_origin": "1"}}, {"id": 699, "text": "the", "bbox": {"l": 533.3333333333334, "t": 561.3333333333334, "r": 544.6666666666666, "b": 568.3333333333334, "coord_origin": "1"}}, {"id": 700, "text": "bounding", "bbox": {"l": 309.0, "t": 573.3333333333334, "r": 346.0, "b": 582.6666666666666, "coord_origin": "1"}}, {"id": 701, "text": "boxes", "bbox": {"l": 349.0, "t": 573.3333333333334, "r": 371.6666666666667, "b": 580.3333333333334, "coord_origin": "1"}}, {"id": 702, "text": "for", "bbox": {"l": 375.0, "t": 573.3333333333334, "r": 386.0, "b": 580.3333333333334, "coord_origin": "1"}}, {"id": 703, "text": "each", "bbox": {"l": 388.6666666666667, "t": 573.3333333333334, "r": 406.3333333333333, "b": 580.3333333333334, "coord_origin": "1"}}, {"id": 704, "text": "table", "bbox": {"l": 409.3333333333333, "t": 573.3333333333334, "r": 428.0, "b": 580.3333333333334, "coord_origin": "1"}}, {"id": 705, "text": "cell.", "bbox": {"l": 431.0, "t": 573.3333333333334, "r": 447.0, "b": 580.3333333333334, "coord_origin": "1"}}, {"id": 706, "text": "A", "bbox": {"l": 451.3333333333333, "t": 573.6666666666666, "r": 457.6666666666667, "b": 580.3333333333334, "coord_origin": "1"}}, {"id": 707, "text": "batching", "bbox": {"l": 460.6666666666667, "t": 573.3333333333334, "r": 494.6666666666667, "b": 582.6666666666666, "coord_origin": "1"}}, {"id": 708, "text": "technique", "bbox": {"l": 497.6666666666667, "t": 573.3333333333334, "r": 535.6666666666666, "b": 582.6666666666666, "coord_origin": "1"}}, {"id": 709, "text": "is", "bbox": {"l": 538.6666666666666, "t": 573.3333333333334, "r": 544.6666666666666, "b": 580.3333333333334, "coord_origin": "1"}}, {"id": 710, "text": "utilized", "bbox": {"l": 309.0, "t": 585.3333333333334, "r": 338.3333333333333, "b": 592.3333333333334, "coord_origin": "1"}}, {"id": 711, "text": "to", "bbox": {"l": 342.3333333333333, "t": 586.6666666666666, "r": 349.3333333333333, "b": 592.3333333333334, "coord_origin": "1"}}, {"id": 712, "text": "optimize", "bbox": {"l": 353.3333333333333, "t": 585.3333333333334, "r": 387.3333333333333, "b": 594.6666666666666, "coord_origin": "1"}}, {"id": 713, "text": "the", "bbox": {"l": 391.3333333333333, "t": 585.3333333333334, "r": 402.6666666666667, "b": 592.3333333333334, "coord_origin": "1"}}, {"id": 714, "text": "runtime", "bbox": {"l": 406.6666666666667, "t": 585.3333333333334, "r": 437.0, "b": 592.3333333333334, "coord_origin": "1"}}, {"id": 715, "text": "overhead", "bbox": {"l": 440.6666666666667, "t": 585.3333333333334, "r": 476.3333333333333, "b": 592.3333333333334, "coord_origin": "1"}}, {"id": 716, "text": "of", "bbox": {"l": 480.3333333333333, "t": 585.3333333333334, "r": 488.6666666666667, "b": 592.3333333333334, "coord_origin": "1"}}, {"id": 717, "text": "the", "bbox": {"l": 492.0, "t": 585.3333333333334, "r": 503.3333333333333, "b": 592.3333333333334, "coord_origin": "1"}}, {"id": 718, "text": "rendering", "bbox": {"l": 507.0, "t": 585.3333333333334, "r": 544.6666666666666, "b": 594.6666666666666, "coord_origin": "1"}}, {"id": 719, "text": "process.", "bbox": {"l": 309.0, "t": 599.6666666666666, "r": 340.3333333333333, "b": 606.6666666666666, "coord_origin": "1"}}]}, "text": "5. Render the complete tables: The synthetic table is finally rendered by a web browser engine to generate the bounding boxes for each table cell. A batching technique is utilized to optimize the runtime overhead of the rendering process."}, {"label": "Section-header", "id": 15, "page_no": 0, "cluster": {"id": 15, "label": "Section-header", "bbox": {"l": 308.37005615234375, "t": 621.5151977539062, "r": 544.79541015625, "b": 646.3232421875, "coord_origin": "1"}, "confidence": 0.9583657383918762, "cells": [{"id": 720, "text": "2.", "bbox": {"l": 309.0, "t": 622.0, "r": 317.3333333333333, "b": 630.3333333333334, "coord_origin": "1"}}, {"id": 721, "text": "Prediction", "bbox": {"l": 323.6666666666667, "t": 622.0, "r": 376.3333333333333, "b": 630.3333333333334, "coord_origin": "1"}}, {"id": 722, "text": "post-processing", "bbox": {"l": 382.6666666666667, "t": 622.0, "r": 461.0, "b": 632.6666666666666, "coord_origin": "1"}}, {"id": 723, "text": "for", "bbox": {"l": 467.0, "t": 622.0, "r": 481.6666666666667, "b": 630.3333333333334, "coord_origin": "1"}}, {"id": 724, "text": "PDF", "bbox": {"l": 487.6666666666667, "t": 622.0, "r": 510.3333333333333, "b": 630.3333333333334, "coord_origin": "1"}}, {"id": 725, "text": "docu-", "bbox": {"l": 516.6666666666666, "t": 622.0, "r": 544.6666666666666, "b": 630.3333333333334, "coord_origin": "1"}}, {"id": 726, "text": "ments", "bbox": {"l": 327.0, "t": 636.6666666666666, "r": 357.0, "b": 644.3333333333334, "coord_origin": "1"}}]}, "text": "2. Prediction post-processing for PDF documents"}, {"label": "Text", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "Text", "bbox": {"l": 308.54010009765625, "t": 656.3193359375, "r": 544.7320556640625, "b": 714.0350341796875, "coord_origin": "1"}, "confidence": 0.9851495027542114, "cells": [{"id": 727, "text": "Although", "bbox": {"l": 321.0, "t": 657.0, "r": 358.0, "b": 666.0, "coord_origin": "1"}}, {"id": 728, "text": "TableFormer", "bbox": {"l": 360.3333333333333, "t": 657.0, "r": 411.3333333333333, "b": 664.0, "coord_origin": "1"}}, {"id": 729, "text": "can", "bbox": {"l": 413.3333333333333, "t": 659.0, "r": 426.6666666666667, "b": 664.0, "coord_origin": "1"}}, {"id": 730, "text": "predict", "bbox": {"l": 429.3333333333333, "t": 657.0, "r": 456.3333333333333, "b": 666.0, "coord_origin": "1"}}, {"id": 731, "text": "the", "bbox": {"l": 459.0, "t": 657.0, "r": 470.3333333333333, "b": 664.0, "coord_origin": "1"}}, {"id": 732, "text": "table", "bbox": {"l": 473.0, "t": 657.0, "r": 491.6666666666667, "b": 664.0, "coord_origin": "1"}}, {"id": 733, "text": "structure", "bbox": {"l": 494.3333333333333, "t": 658.3333333333334, "r": 528.3333333333334, "b": 664.0, "coord_origin": "1"}}, {"id": 734, "text": "and", "bbox": {"l": 531.0, "t": 657.0, "r": 544.6666666666666, "b": 664.0, "coord_origin": "1"}}, {"id": 735, "text": "the", "bbox": {"l": 309.0, "t": 669.0, "r": 320.6666666666667, "b": 676.0, "coord_origin": "1"}}, {"id": 736, "text": "bounding", "bbox": {"l": 323.6666666666667, "t": 669.0, "r": 361.0, "b": 678.0, "coord_origin": "1"}}, {"id": 737, "text": "boxes", "bbox": {"l": 364.0, "t": 669.0, "r": 386.3333333333333, "b": 676.0, "coord_origin": "1"}}, {"id": 738, "text": "for", "bbox": {"l": 389.6666666666667, "t": 669.0, "r": 401.0, "b": 676.0, "coord_origin": "1"}}, {"id": 739, "text": "tables", "bbox": {"l": 403.6666666666667, "t": 669.0, "r": 426.3333333333333, "b": 676.0, "coord_origin": "1"}}, {"id": 740, "text": "recognized", "bbox": {"l": 429.3333333333333, "t": 669.0, "r": 472.3333333333333, "b": 678.0, "coord_origin": "1"}}, {"id": 741, "text": "inside", "bbox": {"l": 475.6666666666667, "t": 669.0, "r": 498.6666666666667, "b": 676.0, "coord_origin": "1"}}, {"id": 742, "text": "PDF", "bbox": {"l": 502.0, "t": 669.0, "r": 520.0, "b": 676.0, "coord_origin": "1"}}, {"id": 743, "text": "docu-", "bbox": {"l": 522.6666666666666, "t": 669.0, "r": 544.6666666666666, "b": 676.0, "coord_origin": "1"}}, {"id": 744, "text": "ments,", "bbox": {"l": 309.0, "t": 682.3333333333334, "r": 334.6666666666667, "b": 688.6666666666666, "coord_origin": "1"}}, {"id": 745, "text": "this", "bbox": {"l": 338.6666666666667, "t": 681.0, "r": 352.3333333333333, "b": 688.0, "coord_origin": "1"}}, {"id": 746, "text": "is", "bbox": {"l": 356.0, "t": 681.0, "r": 361.6666666666667, "b": 688.0, "coord_origin": "1"}}, {"id": 747, "text": "not", "bbox": {"l": 365.3333333333333, "t": 682.3333333333334, "r": 377.3333333333333, "b": 688.0, "coord_origin": "1"}}, {"id": 748, "text": "enough", "bbox": {"l": 381.0, "t": 681.0, "r": 409.6666666666667, "b": 690.0, "coord_origin": "1"}}, {"id": 749, "text": "when", "bbox": {"l": 413.3333333333333, "t": 681.0, "r": 434.3333333333333, "b": 688.0, "coord_origin": "1"}}, {"id": 750, "text": "a", "bbox": {"l": 434.6666666666667, "t": 679.6666666666666, "r": 438.6666666666667, "b": 691.6666666666666, "coord_origin": "1"}}, {"id": 751, "text": "full", "bbox": {"l": 445.3333333333333, "t": 681.0, "r": 458.3333333333333, "b": 688.0, "coord_origin": "1"}}, {"id": 752, "text": "reconstruction", "bbox": {"l": 462.0, "t": 681.0, "r": 518.3333333333334, "b": 688.0, "coord_origin": "1"}}, {"id": 753, "text": "of", "bbox": {"l": 521.6666666666666, "t": 681.0, "r": 530.3333333333334, "b": 688.0, "coord_origin": "1"}}, {"id": 754, "text": "the", "bbox": {"l": 533.3333333333334, "t": 681.0, "r": 544.6666666666666, "b": 688.0, "coord_origin": "1"}}, {"id": 755, "text": "original", "bbox": {"l": 309.0, "t": 693.0, "r": 339.3333333333333, "b": 702.0, "coord_origin": "1"}}, {"id": 756, "text": "table", "bbox": {"l": 342.6666666666667, "t": 693.0, "r": 361.3333333333333, "b": 700.0, "coord_origin": "1"}}, {"id": 757, "text": "is", "bbox": {"l": 365.0, "t": 693.0, "r": 370.6666666666667, "b": 700.0, "coord_origin": "1"}}, {"id": 758, "text": "required.", "bbox": {"l": 374.0, "t": 693.0, "r": 408.6666666666667, "b": 702.0, "coord_origin": "1"}}, {"id": 759, "text": "This", "bbox": {"l": 413.0, "t": 693.0, "r": 430.3333333333333, "b": 700.0, "coord_origin": "1"}}, {"id": 760, "text": "happens", "bbox": {"l": 433.6666666666667, "t": 693.0, "r": 465.6666666666667, "b": 702.0, "coord_origin": "1"}}, {"id": 761, "text": "mainly", "bbox": {"l": 469.0, "t": 693.0, "r": 495.6666666666667, "b": 702.0, "coord_origin": "1"}}, {"id": 762, "text": "due", "bbox": {"l": 499.0, "t": 693.0, "r": 512.6666666666666, "b": 700.0, "coord_origin": "1"}}, {"id": 763, "text": "the", "bbox": {"l": 516.3333333333334, "t": 693.0, "r": 527.6666666666666, "b": 700.0, "coord_origin": "1"}}, {"id": 764, "text": "fol-", "bbox": {"l": 531.0, "t": 693.0, "r": 544.6666666666666, "b": 700.0, "coord_origin": "1"}}, {"id": 765, "text": "lowing", "bbox": {"l": 309.3333333333333, "t": 705.0, "r": 336.0, "b": 714.0, "coord_origin": "1"}}, {"id": 766, "text": "reasons:", "bbox": {"l": 339.0, "t": 707.0, "r": 370.6666666666667, "b": 712.0, "coord_origin": "1"}}]}, "text": "Although TableFormer can predict the table structure and the bounding boxes for tables recognized inside PDF documents, this is not enough when a full reconstruction of the original table is required. This happens mainly due the following reasons:"}], "headers": []}}] |