Extract from File Node
Extraer contenido de texto de documentos y archivos.
Descripción general
El Extract from File Node lee y extrae contenido de texto de varios tipos de archivo, incluyendo PDFs, documentos Word, archivos de texto y más. Convierte el contenido de documentos en texto que puede ser procesado por otros nodos.
Configuración
| Campo | Descripción | Obligatorio |
|---|---|---|
Files Path |
Ruta o URL del/los archivo(s) a extraer | Sí |
Output Variable |
Nombre de la variable para almacenar el texto extraído | Sí |
Tipos de archivo compatibles
- Documentos PDF (.pdf)
- Documentos Word (.docx, .doc)
- Archivos de texto (.txt)
- Archivos Markdown (.md)
- Archivos CSV (.csv)
- Y más...
Uso de variables
Pasar rutas de archivo desde nodos anteriores:
{{uploaded_file.url}}
{{attachment_path}}
{{document_url}}
Casos de uso de ejemplo
Procesar documentos subidos
Files Path: {{user_upload.file_url}}
Output Variable: document_content
Extraer de múltiples archivos
Usar con un bucle For para procesar múltiples archivos:
Files Path: {{current_file.path}}
Output Variable: file_text
Analizar contenido de documentos
Encadenar con un nodo LLM:
- Extract from File →
document_content - LLM Node → Analizar
{{document_content}}
Salida
El texto extraído se almacena en su variable de salida:
{{document_content}}
Diferencias con el nodo OCR
| Característica | Extract from File | OCR Node |
|---|---|---|
| Entrada | Documentos digitales | Imágenes, documentos escaneados |
| Método | Extracción de texto | Reconocimiento óptico |
| Caso de uso | PDFs, documentos Word | Capturas de pantalla, fotos |
| Velocidad | Más rápido | Más lento |
Buenas prácticas
- Úselo para documentos digitales con texto incrustado
- Para documentos escaneados o imágenes, use el nodo OCR en su lugar
- Maneje documentos grandes dividiéndolos en fragmentos si es necesario
- Combínelo con nodos LLM para el análisis de documentos