mirror of
https://github.com/DS4SD/docling.git
synced 2025-07-26 03:55:00 +00:00
* Testing fix for docling-core dt Signed-off-by: Maksym Lysak <mly@zurich.ibm.com> * fix: Fix code_formula test unit, update test-cases Signed-off-by: Christoph Auer <cau@zurich.ibm.com> * fix: Fix code-formula model for new docling-core Signed-off-by: Christoph Auer <cau@zurich.ibm.com> * fix: Update fixes Signed-off-by: Christoph Auer <cau@zurich.ibm.com> * Update test cases for office formats Signed-off-by: Christoph Auer <cau@zurich.ibm.com> * Update deps and lockfile Signed-off-by: Christoph Auer <cau@zurich.ibm.com> * Clean up imports Signed-off-by: Christoph Auer <cau@zurich.ibm.com> --------- Signed-off-by: Maksym Lysak <mly@zurich.ibm.com> Signed-off-by: Christoph Auer <cau@zurich.ibm.com> Co-authored-by: Maksym Lysak <mly@zurich.ibm.com> Co-authored-by: Christoph Auer <cau@zurich.ibm.com>
1 line
3.3 KiB
JSON
1 line
3.3 KiB
JSON
[{"page_no": 0, "size": {"width": 595.201171875, "height": 841.9216918945312}, "cells": [{"id": 0, "text": "Docling bundles PDF document conversion to", "bbox": {"l": 74.0, "t": 78.0, "r": 503.3333333333333, "b": 96.66666666666667, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "JSON and Markdown in an easy self contained", "bbox": {"l": 72.33333333333333, "t": 104.66666666666667, "r": 503.3333333333333, "b": 123.33333333333333, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "package", "bbox": {"l": 73.66666666666667, "t": 131.66666666666666, "r": 150.66666666666666, "b": 150.33333333333334, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 0, "label": "text", "bbox": {"l": 72.33333333333333, "t": 78.0, "r": 503.3333333333333, "b": 150.33333333333334, "coord_origin": "TOPLEFT"}, "confidence": 0.9715733528137207, "cells": [{"id": 0, "text": "Docling bundles PDF document conversion to", "bbox": {"l": 74.0, "t": 78.0, "r": 503.3333333333333, "b": 96.66666666666667, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "JSON and Markdown in an easy self contained", "bbox": {"l": 72.33333333333333, "t": 104.66666666666667, "r": 503.3333333333333, "b": 123.33333333333333, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "package", "bbox": {"l": 73.66666666666667, "t": 131.66666666666666, "r": 150.66666666666666, "b": 150.33333333333334, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 72.33333333333333, "t": 78.0, "r": 503.3333333333333, "b": 150.33333333333334, "coord_origin": "TOPLEFT"}, "confidence": 0.9715733528137207, "cells": [{"id": 0, "text": "Docling bundles PDF document conversion to", "bbox": {"l": 74.0, "t": 78.0, "r": 503.3333333333333, "b": 96.66666666666667, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "JSON and Markdown in an easy self contained", "bbox": {"l": 72.33333333333333, "t": 104.66666666666667, "r": 503.3333333333333, "b": 123.33333333333333, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "package", "bbox": {"l": 73.66666666666667, "t": 131.66666666666666, "r": 150.66666666666666, "b": 150.33333333333334, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Docling bundles PDF document conversion to JSON and Markdown in an easy self contained package"}], "body": [{"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 72.33333333333333, "t": 78.0, "r": 503.3333333333333, "b": 150.33333333333334, "coord_origin": "TOPLEFT"}, "confidence": 0.9715733528137207, "cells": [{"id": 0, "text": "Docling bundles PDF document conversion to", "bbox": {"l": 74.0, "t": 78.0, "r": 503.3333333333333, "b": 96.66666666666667, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "JSON and Markdown in an easy self contained", "bbox": {"l": 72.33333333333333, "t": 104.66666666666667, "r": 503.3333333333333, "b": 123.33333333333333, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "package", "bbox": {"l": 73.66666666666667, "t": 131.66666666666666, "r": 150.66666666666666, "b": 150.33333333333334, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Docling bundles PDF document conversion to JSON and Markdown in an easy self contained package"}], "headers": []}}] |