Documentation is being updated. Some sections may not reflect the latest features.

Extract from File Node

Extrageți conținut text din documente și fișiere.

Prezentare generală

Nodul Extract from File citește și extrage conținut text din diverse tipuri de fișiere, inclusiv PDF-uri, documente Word, fișiere text și altele. Convertește conținutul documentelor în text care poate fi procesat de alte noduri.

Configurare

Câmp Descriere Obligatoriu
Files Path Calea sau URL-ul fișierului/fișierelor din care se extrage Da
Output Variable Numele variabilei pentru stocarea textului extras Da

Tipuri de fișiere suportate

  • Documente PDF (.pdf)
  • Documente Word (.docx, .doc)
  • Fișiere text (.txt)
  • Fișiere Markdown (.md)
  • Fișiere CSV (.csv)
  • Și altele...

Utilizarea variabilelor

Transmiteți căi de fișiere din nodurile anterioare:

{{uploaded_file.url}}
{{attachment_path}}
{{document_url}}

Exemple de utilizare

Procesarea documentelor încărcate

Files Path: {{user_upload.file_url}}
Output Variable: document_content

Extragerea din mai multe fișiere

Folosiți cu o buclă For pentru a procesa mai multe fișiere:

Files Path: {{current_file.path}}
Output Variable: file_text

Analiza conținutului documentelor

Înlănțuiți cu un nod LLM:

  1. Extract from File → document_content
  2. LLM Node → Analizează {{document_content}}

Ieșire

Textul extras este stocat în variabila de ieșire:

{{document_content}}

Diferențe față de nodul OCR

Caracteristică Extract from File OCR Node
Intrare Documente digitale Imagini, documente scanate
Metodă Extragere de text Recunoaștere optică
Caz de utilizare PDF-uri, documente Word Capturi de ecran, fotografii
Viteză Mai rapid Mai lent

Bune practici

  • Folosiți-l pentru documente digitale cu text încorporat
  • Pentru documente scanate sau imagini, folosiți în schimb nodul OCR
  • Gestionați documentele mari prin împărțire în fragmente dacă este necesar
  • Combinați-l cu noduri LLM pentru analiza documentelor
AI AssistantPowered by Ubex
Beta
Ask me anything about Ubex workflows, nodes, or the API.
~/

Salut 👋

Cu ce te putem ajuta astăzi?