docs: add Data Prep Kit integration

Signed-off-by: Panos Vagenas <35837085+vagenas@users.noreply.github.com>
2025-07-30 14:04:27 +00:00 · 2024-11-12 11:09:40 +01:00 · 2024-11-12 11:09:40 +01:00 · 32055fe9d6
commit 32055fe9d6
parent 81c8243a8b
3 changed files with 17 additions and 3 deletions
--- a/docs/integrations/data_prep_kit.md
+++ b/docs/integrations/data_prep_kit.md
@ -0,0 +1,13 @@
+## Get started
+
+Docling is used by the [Data Prep Kit \[↗\]](https://ibm.github.io/data-prep-kit/) open-source toolkit for preparing unstructured data for LLM application development ranging from laptop scale to datacenter scale.
+
+Below you find the Data Prep Kit modules powered by Docling.
+
+## PDF ingestion to Parquet
+- 💻 [GitHub \[↗\]](https://github.com/IBM/data-prep-kit/tree/dev/transforms/language/pdf2parquet)
+- 📖 [API docs \[↗\]](https://ibm.github.io/data-prep-kit/transforms/language/pdf2parquet/python/)
+
+## Document chunking
+- 💻 [GitHub \[↗\]](https://github.com/IBM/data-prep-kit/tree/dev/transforms/language/doc_chunk)
+- 📖 [API docs \[↗\]](https://ibm.github.io/data-prep-kit/transforms/language/doc_chunk/python/)
--- a/docs/integrations/llamaindex.md
+++ b/docs/integrations/llamaindex.md
@ -1,6 +1,6 @@
 ## Get started

-Docling is available as an official LlamaIndex extension!
+Docling is available as an official [LlamaIndex \[↗\]](https://docs.llamaindex.ai/) extension.

 To get started, check out the [step-by-step guide in LlamaIndex \[↗\]](https://docs.llamaindex.ai/en/stable/examples/data_connectors/DoclingReaderDemo/)<!--{target="_blank"}-->.

--- a/mkdocs.yml
+++ b/mkdocs.yml
@ -80,8 +80,9 @@ nav:
    #   - CLI: examples/cli.md
  - Integrations:
    - Integrations: integrations/index.md
-    - "LlamaIndex 🦙 extension": integrations/llamaindex.md
-    # - "LangChain 🦜🔗 extension": integrations/langchain.md
+    - "Data Prep Kit": integrations/data_prep_kit.md
+    - "LlamaIndex 🦙": integrations/llamaindex.md
+    # - "LangChain 🦜🔗": integrations/langchain.md
  # - API reference:
  #   - API reference: api_reference/index.md