mark_it_down
Inhoud
MarkItDown
ποΈ Terug naar start
Python MarkItDown artikel op realpython.com
MarkItDown is een Python-bibliotheek die het mogelijk maakt om diverse bestandsformatenβzoals PDF, Office-documenten (Word, Excel, PowerPoint), afbeeldingen, HTML, audio en ZIP-bestandenβautomatisch en snel om te zetten naar LLM-ready (Large Language Model) Markdown-tekst. Dit maakt het ideaal voor het voeden van AI-workflows en tekstanalyse-pipelines waarbij token-efficiΓ«ntie en gestructureerde content gewenst zijn
Installeren
Consul:
python -m pip install 'markitdown[all]'
Gebruik
Consul:
markitdown path-to-file.pdf > document.md
mark_it_down.txt Β· Laatst gewijzigd: door a3dijke
