Documentation is being updated. Some sections may not reflect the latest features.

Extract from File Node

Extraer contenido de texto de documentos y archivos.

Descripción general

El Extract from File Node lee y extrae contenido de texto de varios tipos de archivo, incluyendo PDFs, documentos Word, archivos de texto y más. Convierte el contenido de documentos en texto que puede ser procesado por otros nodos.

Configuración

Campo Descripción Obligatorio
Files Path Ruta o URL del/los archivo(s) a extraer
Output Variable Nombre de la variable para almacenar el texto extraído

Tipos de archivo compatibles

  • Documentos PDF (.pdf)
  • Documentos Word (.docx, .doc)
  • Archivos de texto (.txt)
  • Archivos Markdown (.md)
  • Archivos CSV (.csv)
  • Y más...

Uso de variables

Pasar rutas de archivo desde nodos anteriores:

{{uploaded_file.url}}
{{attachment_path}}
{{document_url}}

Casos de uso de ejemplo

Procesar documentos subidos

Files Path: {{user_upload.file_url}}
Output Variable: document_content

Extraer de múltiples archivos

Usar con un bucle For para procesar múltiples archivos:

Files Path: {{current_file.path}}
Output Variable: file_text

Analizar contenido de documentos

Encadenar con un nodo LLM:

  1. Extract from File → document_content
  2. LLM Node → Analizar {{document_content}}

Salida

El texto extraído se almacena en su variable de salida:

{{document_content}}

Diferencias con el nodo OCR

Característica Extract from File OCR Node
Entrada Documentos digitales Imágenes, documentos escaneados
Método Extracción de texto Reconocimiento óptico
Caso de uso PDFs, documentos Word Capturas de pantalla, fotos
Velocidad Más rápido Más lento

Buenas prácticas

  • Úselo para documentos digitales con texto incrustado
  • Para documentos escaneados o imágenes, use el nodo OCR en su lugar
  • Maneje documentos grandes dividiéndolos en fragmentos si es necesario
  • Combínelo con nodos LLM para el análisis de documentos
AI AssistantPowered by Ubex
Beta
Ask me anything about Ubex workflows, nodes, or the API.
~/

Hola 👋

¿Cómo podemos ayudarte hoy?