Extract from File Node
Extrageți conținut text din documente și fișiere.
Prezentare generală
Nodul Extract from File citește și extrage conținut text din diverse tipuri de fișiere, inclusiv PDF-uri, documente Word, fișiere text și altele. Convertește conținutul documentelor în text care poate fi procesat de alte noduri.
Configurare
| Câmp | Descriere | Obligatoriu |
|---|---|---|
Files Path |
Calea sau URL-ul fișierului/fișierelor din care se extrage | Da |
Output Variable |
Numele variabilei pentru stocarea textului extras | Da |
Tipuri de fișiere suportate
- Documente PDF (.pdf)
- Documente Word (.docx, .doc)
- Fișiere text (.txt)
- Fișiere Markdown (.md)
- Fișiere CSV (.csv)
- Și altele...
Utilizarea variabilelor
Transmiteți căi de fișiere din nodurile anterioare:
{{uploaded_file.url}}
{{attachment_path}}
{{document_url}}
Exemple de utilizare
Procesarea documentelor încărcate
Files Path: {{user_upload.file_url}}
Output Variable: document_content
Extragerea din mai multe fișiere
Folosiți cu o buclă For pentru a procesa mai multe fișiere:
Files Path: {{current_file.path}}
Output Variable: file_text
Analiza conținutului documentelor
Înlănțuiți cu un nod LLM:
- Extract from File →
document_content - LLM Node → Analizează
{{document_content}}
Ieșire
Textul extras este stocat în variabila de ieșire:
{{document_content}}
Diferențe față de nodul OCR
| Caracteristică | Extract from File | OCR Node |
|---|---|---|
| Intrare | Documente digitale | Imagini, documente scanate |
| Metodă | Extragere de text | Recunoaștere optică |
| Caz de utilizare | PDF-uri, documente Word | Capturi de ecran, fotografii |
| Viteză | Mai rapid | Mai lent |
Bune practici
- Folosiți-l pentru documente digitale cu text încorporat
- Pentru documente scanate sau imagini, folosiți în schimb nodul OCR
- Gestionați documentele mari prin împărțire în fragmente dacă este necesar
- Combinați-l cu noduri LLM pentru analiza documentelor