docling/tests/data_scanned/groundtruth/docling_v1/ocr_test.json
Clément Doumouro 7b4a4457e8 fix(layout,table): update e2e test
Signed-off-by: Clément Doumouro <clement.doumouro@gmail.com>
2025-07-09 17:06:30 +02:00

351 lines
7.2 KiB
JSON
Vendored

{
"_name": "",
"type": "pdf-document",
"description": {
"title": null,
"abstract": null,
"authors": null,
"affiliations": null,
"subjects": null,
"keywords": null,
"publication_date": null,
"languages": null,
"license": null,
"publishers": null,
"url_refs": null,
"references": null,
"publication": null,
"reference_count": null,
"citation_count": null,
"citation_date": null,
"advanced": null,
"analytics": null,
"logs": [],
"collection": null,
"acquisition": null
},
"file-info": {
"filename": "ocr_test.pdf",
"filename-prov": null,
"document-hash": "0f391d12850f72bb91897f7f3bebfd4a0a8357e2a883ac1f664e32342c04e418",
"#-pages": 1,
"collection-name": null,
"description": null,
"page-hashes": [
{
"hash": "32f328168da3f69890a725c1168799f9ff7337249e98b1f36c12965551477be5",
"model": "default",
"page": 1
}
]
},
"main-text": [
{
"name": "Table",
"type": "table",
"$ref": "#/tables/0"
}
],
"figures": [],
"tables": [
{
"prov": [
{
"bbox": [
69.04969024658203,
277.41973876953125,
551.0990600585938,
524.3504486083984
],
"page": 1,
"span": [
0,
0
],
"__ref_s3_data": null
}
],
"text": "",
"type": "table",
"payload": null,
"#-cols": 3,
"#-rows": 3,
"data": [
[
{
"bbox": [
97.33333333333333,
105.66666666666666,
190.0,
126.33333333333334
],
"spans": [
[
0,
0
]
],
"text": "Vertically merged",
"type": "col_header",
"col": 0,
"col-header": true,
"col-span": [
0,
1
],
"row": 0,
"row-header": false,
"row-span": [
0,
1
]
},
{
"bbox": [
232.66666666666666,
105.66666666666666,
364.0,
126.33333333333334
],
"spans": [
[
0,
1
]
],
"text": "Other merged column",
"type": "col_header",
"col": 1,
"col-header": true,
"col-span": [
1,
2
],
"row": 0,
"row-header": false,
"row-span": [
0,
1
]
},
{
"bbox": [
406.3333333333333,
105.66666666666666,
518.3333333333333,
121.66666666666666
],
"spans": [
[
0,
2
]
],
"text": "Yet another column",
"type": "col_header",
"col": 2,
"col-header": true,
"col-span": [
2,
3
],
"row": 0,
"row-header": false,
"row-span": [
0,
1
]
}
],
[
{
"bbox": [
121.66666666666667,
204.33333333333334,
168.66666666666666,
220.0
],
"spans": [
[
1,
0
]
],
"text": "value",
"type": "body",
"col": 0,
"col-header": false,
"col-span": [
0,
1
],
"row": 1,
"row-header": false,
"row-span": [
1,
2
]
},
{
"bbox": [
247.0,
188.33333333333331,
349.6666666666667,
204.33333333333334
],
"spans": [
[
1,
1
]
],
"text": "Some other value",
"type": "body",
"col": 1,
"col-header": false,
"col-span": [
1,
2
],
"row": 1,
"row-header": false,
"row-span": [
1,
2
]
},
{
"bbox": [
408.3333333333333,
188.33333333333331,
514.0,
204.33333333333334
],
"spans": [
[
1,
2
]
],
"text": "Yet another value",
"type": "body",
"col": 2,
"col-header": false,
"col-span": [
2,
3
],
"row": 1,
"row-header": false,
"row-span": [
1,
2
]
}
],
[
{
"bbox": [
121.66666666666667,
284.0,
168.66666666666666,
300.0
],
"spans": [
[
2,
0
]
],
"text": "value",
"type": "body",
"col": 0,
"col-header": false,
"col-span": [
0,
1
],
"row": 2,
"row-header": false,
"row-span": [
2,
3
]
},
{
"bbox": [
247.0,
268.0,
349.6666666666667,
284.0
],
"spans": [
[
2,
1
]
],
"text": "Some other value",
"type": "body",
"col": 1,
"col-header": false,
"col-span": [
1,
2
],
"row": 2,
"row-header": false,
"row-span": [
2,
3
]
},
{
"bbox": [
408.3333333333333,
268.0,
514.0,
284.0
],
"spans": [
[
2,
2
]
],
"text": "Yet another value",
"type": "body",
"col": 2,
"col-header": false,
"col-span": [
2,
3
],
"row": 2,
"row-header": false,
"row-span": [
2,
3
]
}
]
],
"model": null,
"bounding-box": null
}
],
"bitmaps": null,
"equations": [],
"footnotes": [],
"page-dimensions": [
{
"height": 612.0,
"page": 1,
"width": 792.0
}
],
"page-footers": [],
"page-headers": [],
"_s3_data": null,
"identifiers": null
}