mirror of
https://github.com/DS4SD/docling.git
synced 2025-07-26 12:04:31 +00:00
351 lines
7.2 KiB
JSON
Vendored
351 lines
7.2 KiB
JSON
Vendored
{
|
|
"_name": "",
|
|
"type": "pdf-document",
|
|
"description": {
|
|
"title": null,
|
|
"abstract": null,
|
|
"authors": null,
|
|
"affiliations": null,
|
|
"subjects": null,
|
|
"keywords": null,
|
|
"publication_date": null,
|
|
"languages": null,
|
|
"license": null,
|
|
"publishers": null,
|
|
"url_refs": null,
|
|
"references": null,
|
|
"publication": null,
|
|
"reference_count": null,
|
|
"citation_count": null,
|
|
"citation_date": null,
|
|
"advanced": null,
|
|
"analytics": null,
|
|
"logs": [],
|
|
"collection": null,
|
|
"acquisition": null
|
|
},
|
|
"file-info": {
|
|
"filename": "ocr_test.pdf",
|
|
"filename-prov": null,
|
|
"document-hash": "0f391d12850f72bb91897f7f3bebfd4a0a8357e2a883ac1f664e32342c04e418",
|
|
"#-pages": 1,
|
|
"collection-name": null,
|
|
"description": null,
|
|
"page-hashes": [
|
|
{
|
|
"hash": "32f328168da3f69890a725c1168799f9ff7337249e98b1f36c12965551477be5",
|
|
"model": "default",
|
|
"page": 1
|
|
}
|
|
]
|
|
},
|
|
"main-text": [
|
|
{
|
|
"name": "Table",
|
|
"type": "table",
|
|
"$ref": "#/tables/0"
|
|
}
|
|
],
|
|
"figures": [],
|
|
"tables": [
|
|
{
|
|
"prov": [
|
|
{
|
|
"bbox": [
|
|
69.04969024658203,
|
|
277.41973876953125,
|
|
551.0990600585938,
|
|
524.3504486083984
|
|
],
|
|
"page": 1,
|
|
"span": [
|
|
0,
|
|
0
|
|
],
|
|
"__ref_s3_data": null
|
|
}
|
|
],
|
|
"text": "",
|
|
"type": "table",
|
|
"payload": null,
|
|
"#-cols": 3,
|
|
"#-rows": 3,
|
|
"data": [
|
|
[
|
|
{
|
|
"bbox": [
|
|
97.33333333333333,
|
|
105.66666666666666,
|
|
190.0,
|
|
126.33333333333334
|
|
],
|
|
"spans": [
|
|
[
|
|
0,
|
|
0
|
|
]
|
|
],
|
|
"text": "Vertically merged",
|
|
"type": "col_header",
|
|
"col": 0,
|
|
"col-header": true,
|
|
"col-span": [
|
|
0,
|
|
1
|
|
],
|
|
"row": 0,
|
|
"row-header": false,
|
|
"row-span": [
|
|
0,
|
|
1
|
|
]
|
|
},
|
|
{
|
|
"bbox": [
|
|
232.66666666666666,
|
|
105.66666666666666,
|
|
364.0,
|
|
126.33333333333334
|
|
],
|
|
"spans": [
|
|
[
|
|
0,
|
|
1
|
|
]
|
|
],
|
|
"text": "Other merged column",
|
|
"type": "col_header",
|
|
"col": 1,
|
|
"col-header": true,
|
|
"col-span": [
|
|
1,
|
|
2
|
|
],
|
|
"row": 0,
|
|
"row-header": false,
|
|
"row-span": [
|
|
0,
|
|
1
|
|
]
|
|
},
|
|
{
|
|
"bbox": [
|
|
406.3333333333333,
|
|
105.66666666666666,
|
|
518.3333333333333,
|
|
121.66666666666666
|
|
],
|
|
"spans": [
|
|
[
|
|
0,
|
|
2
|
|
]
|
|
],
|
|
"text": "Yet another column",
|
|
"type": "col_header",
|
|
"col": 2,
|
|
"col-header": true,
|
|
"col-span": [
|
|
2,
|
|
3
|
|
],
|
|
"row": 0,
|
|
"row-header": false,
|
|
"row-span": [
|
|
0,
|
|
1
|
|
]
|
|
}
|
|
],
|
|
[
|
|
{
|
|
"bbox": [
|
|
121.66666666666667,
|
|
204.33333333333334,
|
|
168.66666666666666,
|
|
220.0
|
|
],
|
|
"spans": [
|
|
[
|
|
1,
|
|
0
|
|
]
|
|
],
|
|
"text": "value",
|
|
"type": "body",
|
|
"col": 0,
|
|
"col-header": false,
|
|
"col-span": [
|
|
0,
|
|
1
|
|
],
|
|
"row": 1,
|
|
"row-header": false,
|
|
"row-span": [
|
|
1,
|
|
2
|
|
]
|
|
},
|
|
{
|
|
"bbox": [
|
|
247.0,
|
|
188.33333333333331,
|
|
349.6666666666667,
|
|
204.33333333333334
|
|
],
|
|
"spans": [
|
|
[
|
|
1,
|
|
1
|
|
]
|
|
],
|
|
"text": "Some other value",
|
|
"type": "body",
|
|
"col": 1,
|
|
"col-header": false,
|
|
"col-span": [
|
|
1,
|
|
2
|
|
],
|
|
"row": 1,
|
|
"row-header": false,
|
|
"row-span": [
|
|
1,
|
|
2
|
|
]
|
|
},
|
|
{
|
|
"bbox": [
|
|
408.3333333333333,
|
|
188.33333333333331,
|
|
514.0,
|
|
204.33333333333334
|
|
],
|
|
"spans": [
|
|
[
|
|
1,
|
|
2
|
|
]
|
|
],
|
|
"text": "Yet another value",
|
|
"type": "body",
|
|
"col": 2,
|
|
"col-header": false,
|
|
"col-span": [
|
|
2,
|
|
3
|
|
],
|
|
"row": 1,
|
|
"row-header": false,
|
|
"row-span": [
|
|
1,
|
|
2
|
|
]
|
|
}
|
|
],
|
|
[
|
|
{
|
|
"bbox": [
|
|
121.66666666666667,
|
|
284.0,
|
|
168.66666666666666,
|
|
300.0
|
|
],
|
|
"spans": [
|
|
[
|
|
2,
|
|
0
|
|
]
|
|
],
|
|
"text": "value",
|
|
"type": "body",
|
|
"col": 0,
|
|
"col-header": false,
|
|
"col-span": [
|
|
0,
|
|
1
|
|
],
|
|
"row": 2,
|
|
"row-header": false,
|
|
"row-span": [
|
|
2,
|
|
3
|
|
]
|
|
},
|
|
{
|
|
"bbox": [
|
|
247.0,
|
|
268.0,
|
|
349.6666666666667,
|
|
284.0
|
|
],
|
|
"spans": [
|
|
[
|
|
2,
|
|
1
|
|
]
|
|
],
|
|
"text": "Some other value",
|
|
"type": "body",
|
|
"col": 1,
|
|
"col-header": false,
|
|
"col-span": [
|
|
1,
|
|
2
|
|
],
|
|
"row": 2,
|
|
"row-header": false,
|
|
"row-span": [
|
|
2,
|
|
3
|
|
]
|
|
},
|
|
{
|
|
"bbox": [
|
|
408.3333333333333,
|
|
268.0,
|
|
514.0,
|
|
284.0
|
|
],
|
|
"spans": [
|
|
[
|
|
2,
|
|
2
|
|
]
|
|
],
|
|
"text": "Yet another value",
|
|
"type": "body",
|
|
"col": 2,
|
|
"col-header": false,
|
|
"col-span": [
|
|
2,
|
|
3
|
|
],
|
|
"row": 2,
|
|
"row-header": false,
|
|
"row-span": [
|
|
2,
|
|
3
|
|
]
|
|
}
|
|
]
|
|
],
|
|
"model": null,
|
|
"bounding-box": null
|
|
}
|
|
],
|
|
"bitmaps": null,
|
|
"equations": [],
|
|
"footnotes": [],
|
|
"page-dimensions": [
|
|
{
|
|
"height": 612.0,
|
|
"page": 1,
|
|
"width": 792.0
|
|
}
|
|
],
|
|
"page-footers": [],
|
|
"page-headers": [],
|
|
"_s3_data": null,
|
|
"identifiers": null
|
|
} |