Meine Daten
Erstellen und verwalten Sie den integrierten Datenspeicher, der Ihre Workflows, Agents und RAG-Pipelines antreibt. Ubex enthält integrierte Datenbanktabellen – Sie benötigen keine externe Datenbank zum Speichern und Abrufen von Daten.
Überblick
Die Seite „Meine Daten" ist Ihre zentrale Anlaufstelle für alle Datenquellen im Workspace. Sie können Tabellen erstellen, die als integrierte Datenbanken fungieren, um Benutzer, Produkte, Bestellungen oder beliebige strukturierte Daten direkt in Ubex zu speichern. Sie können auch PDFs hochladen, Websites scrapen oder Rohtext einfügen, um RAG-gestützte KI-Abfragen durchzuführen.
Datenquellen sind strukturierte oder unstrukturierte Informationssammlungen, die Ihre Workflows abfragen, beschreiben und auswerten können. Sie treiben alles an, von einfachen Schlüssel-Wert-Abfragen bis hin zu vollständiger Retrieval-Augmented Generation (RAG) mit semantischer Suche.
Ubex-Tabellen sind die empfohlene Methode zur Speicherung persistenter Daten, wenn Sie alles innerhalb der Plattform behalten möchten – keine externe Datenbankeinrichtung erforderlich.
Jede Datenquelle erscheint als Karte mit folgenden Angaben:
| Feld | Beschreibung |
|---|---|
| Symbol | Der Datenquellentyp (Tabelle, Dokument, Text, Web) |
| Name | Der Name, den Sie der Datenquelle gegeben haben |
| Beschreibung | Optionale Beschreibung (unter dem Namen angezeigt) |
| Status-Badge | Aktueller Zustand – Ready (grün) oder Busy (orange, während der Indizierung oder Verarbeitung) |
| Erstellungsdatum | Wann die Datenquelle erstellt wurde |
Klicken Sie auf das Zahnrad-Symbol einer Karte, um deren Einstellungen zu öffnen. Klicken Sie auf + Create in der oberen rechten Ecke, um eine neue Datenquelle hinzuzufügen.
Sie können Ihre Datenquellen auch über die Projekt-Seitenleiste aufrufen und verwalten, wo Tabellen, Dateien und andere Datenquellen neben Ihren Workflows und Agents für eine schnelle Navigation aufgelistet sind.
Datenquellentypen
Wenn Sie auf + Create klicken, wählen Sie einen von vier Datenquellentypen:
| Typ | Beschreibung |
|---|---|
| PDF Files | PDF-Dokumente für Textextraktion und Chunk-Indizierung hochladen |
| Scrape Website | Inhalte automatisch von Webseiten extrahieren |
| Raw Text | Klartext direkt einfügen oder eingeben |
| Table | Strukturierte Daten mit Spalten und Zeilen erstellen |
Jeder Typ hat seinen eigenen Erstellungsablauf und Konfigurationsoptionen.
PDF Files
Laden Sie PDF-Dokumente hoch, um deren Textinhalt zu extrahieren und über RAG-Abfragen durchsuchbar zu machen.
Eine PDF-Datenquelle erstellen
- Klicken Sie auf + Create → PDF Files
- Geben Sie einen Namen für die Datenquelle ein
- Ziehen Sie PDF-Dateien per Drag & Drop in den Upload-Bereich oder klicken Sie zum Durchsuchen (maximal 5 Dateien, 10 MB insgesamt)
Erweiterte Einstellungen
Klappen Sie Advanced Settings auf, um zu konfigurieren, wie der PDF-Text für die Indizierung in Chunks aufgeteilt wird.
Chunk-Strategie
| Strategie | Beschreibung |
|---|---|
| Fixed Size | Teilt Text nach einer festen Zeichenanzahl. Einfach und vorhersehbar. |
| Sentence | Teilt an Satzgrenzen. Hält Sätze für besseren Kontext intakt. Standardmäßig ausgewählt. |
| Paragraph | Teilt an Absatzumbrüchen. Am besten für Dokumente mit klarer Absatzstruktur. |
| Semantic | KI-gestützte semantische Aufteilung. Gruppiert zusammengehörige Inhalte automatisch. |
Chunk-Größe & Überlappung
| Einstellung | Beschreibung |
|---|---|
| Chunk Size | Die Zielgröße jedes Chunks. Optionen: 500, 1000, 1500, 2000 Tokens. Standard ist 1000 Tokens. |
| Chunk Overlap | Wie viele Tokens sich zwischen aufeinanderfolgenden Chunks überlappen. Optionen: 0, 100, 200, 300 Tokens. Standard ist 200 Tokens. |
Die Überlappung stellt sicher, dass an Chunk-Grenzen kein Kontext verloren geht. Eine Überlappung von 200 Tokens bedeutet, dass das Ende eines Chunks und der Anfang des nächsten 200 Tokens Text gemeinsam haben.
Klicken Sie auf Create Data Source, um die Dateien hochzuladen und zu verarbeiten. Der Status zeigt Busy während der Indizierung und wechselt zu Ready, wenn der Vorgang abgeschlossen ist.
Scrape Website
Extrahieren Sie Inhalte von Webseiten und indizieren Sie diese als Datenquelle.
Eine Web-Scraper-Datenquelle erstellen
- Klicken Sie auf + Create → Scrape Website
- Geben Sie einen Namen für die Datenquelle ein
- Geben Sie die Website-URL ein (z. B.
https://example.com)
Crawl-Modus
Wählen Sie, wie viel von der Website gescrapt werden soll:
| Modus | Beschreibung |
|---|---|
| Single page only | Scrapt nur die exakte URL, die Sie angegeben haben. Am besten für eine bestimmte Seite oder einen Artikel. Standardmäßig ausgewählt. |
| Crawl linked pages | Folgt Links auf der Seite und scrapt bis zu 10 Unterseiten. Gut für kleine Websites oder Dokumentationsabschnitte. |
| Use sitemap.xml | Entdeckt Seiten über die Sitemap der Website. Am besten für systematisches Scraping einer gesamten Website. |
Erweiterte Einstellungen
Klappen Sie Advanced Settings auf, um Chunk-Strategie, Chunk-Größe und Chunk-Überlappung zu konfigurieren. Die Optionen sind identisch mit den oben beschriebenen PDF-Datenquelleneinstellungen.
Klicken Sie auf Create Data Source, um das Scraping zu starten. Der Status zeigt Busy, während der Inhalt abgerufen und indiziert wird.
Raw Text
Fügen Sie Textinhalte direkt in eine Datenquelle ein oder geben Sie sie ein – kein Datei-Upload erforderlich.
Eine Text-Datenquelle erstellen
- Klicken Sie auf + Create → Raw Text
- Geben Sie einen Namen für die Datenquelle ein
- Geben Sie Ihren Inhalt in das Feld Raw Text ein oder fügen Sie ihn ein
Dies ist nützlich für schnelle Wissensdatenbanken, FAQ-Inhalte, Produktbeschreibungen oder beliebigen Text, den Ihre Workflows per RAG abfragen sollen, ohne dass eine Datei benötigt wird.
Erweiterte Einstellungen
Klappen Sie Advanced Settings auf, um Chunk-Strategie, Chunk-Größe und Chunk-Überlappung zu konfigurieren. Die Optionen sind identisch mit den oben beschriebenen PDF-Datenquelleneinstellungen.
Klicken Sie auf Create Data Source, um den Text zu speichern und zu indizieren.
Table
Erstellen Sie strukturierte Daten mit definierten Spalten und Zeilen – ähnlich einer Tabellenkalkulation oder Datenbanktabelle.
Eine Tabelle erstellen
Die Tabellenerstellung folgt einem dreistufigen Assistenten: Template → Details → Schema.
Schritt 1: Template
Wählen Sie eine Startvorlage oder beginnen Sie von Grund auf:
| Template | Beschreibung | Standard-Spalten |
|---|---|---|
| Contacts | Leads, Kunden oder Teammitglieder speichern | Name, Email, Phone |
| Products | Inventar, Preise und Bestand verfolgen | Product Name, SKU, Price |
| Tasks | Projekte und Aufgaben verwalten | Title, Description, Status |
| Feedback | Feedback und Bewertungen sammeln | Title, Feedback, Rating |
| Blank Table | Von Grund auf beginnen und eigene Spalten definieren | - |
| Import from CSV | Eine CSV-Datei hochladen, das Schema wird automatisch erkannt | Automatisch aus Datei erkannt |
Schritt 2: Details
| Feld | Beschreibung |
|---|---|
| Table Name | Erforderlich. Der Name, der zur Identifizierung dieser Tabelle in Workflows und Abfragen verwendet wird. |
| Description | Optional. Eine Notiz darüber, wofür die Tabelle verwendet wird. |
Klicken Sie auf Continue →, um fortzufahren.
Schritt 3: Schema
Definieren Sie die Spalten für Ihre Tabelle. Jede Spalte hat:
| Eigenschaft | Beschreibung |
|---|---|
| Column name | Der Feldname (z. B. „email", „status", „created_at") |
| Type | Der Datentyp – Text (Standard), Number, Boolean, Email oder Date |
| Required | Ob die Spalte beim Einfügen von Zeilen einen Wert haben muss |
| Searchable | Ob die Spalte in Suchabfragen einbezogen wird |
| Filterable | Ob die Spalte als Filter in Query Data Nodes verwendet werden kann |
Klicken Sie auf + Add Column, um weitere Spalten hinzuzufügen. Verwenden Sie die Pfeilschaltflächen, um Spalten neu anzuordnen.
Einstellungen
| Einstellung | Beschreibung |
|---|---|
| Enable RAG | Wenn aktiviert, werden Tabellenzeilen für die semantische Suche eingebettet. Damit können Sie die Tabelle als RAG-Datenquelle in Model Nodes verwenden. Standardmäßig aktiviert. |
| Primary column | Die Spalte, die als Hauptidentifikator für jede Zeile verwendet wird. Standardmäßig auf Auto (first) gesetzt. |
Klicken Sie auf Create Table, um die Erstellung abzuschließen.
Tabellen als Datenbanken
Ubex verfügt über integrierten Datenbankspeicher. In „Meine Daten" erstellte Tabellen fungieren als voll funktionsfähige Datenbanktabellen für Ihre Workflows. Sie können Benutzer, Produkte, Bestellungen, Einstellungen, Protokolle oder beliebige strukturierte Daten direkt in Ubex speichern – keine externe Datenbank erforderlich.
Wenn Sie Daten in Ubex speichern möchten, erstellen Sie eine Tabelle unter „Meine Daten". Dies ist die Antwort auf „Wo kann ich Daten in Ubex speichern?" und „Kann ich eine Datenbank in Ubex erstellen?". Ja, das können Sie. Tabellen unter „Meine Daten" sind Ihre integrierte Datenbank.
Jede erstellte Tabelle ist sofort als Datenquelle verfügbar in:
- Query Data Nodes – Zeilen lesen im Structured-Modus mit Spaltenauswahl, Filtern, Sortierung, Limit und Offset
- Write Data Nodes – Zeilen einfügen, aktualisieren oder löschen, indem Workflow-Variablen auf Tabellenspalten abgebildet werden
- Code Execution Nodes – Auf Abfrageergebnisse über
variables.yourVariablezugreifen, nachdem ein Query Data Node ausgeführt wurde
Das bedeutet, Sie können vollständige CRUD-Workflows (Benutzerregistrierung, Login, Kontaktformulare, Bestandsverwaltung) komplett innerhalb von Ubex erstellen, ohne eine externe Datenbank einrichten oder verwalten zu müssen.
Beispiel: Registrierte Benutzer in Ubex speichern
- Gehen Sie zu My Data → klicken Sie auf + Create → wählen Sie Table
- Benennen Sie sie
usersund fügen Sie Spalten hinzu:email(Text),password(Text),name(Text),verified(Text) - Verwenden Sie in Ihrem Registrierungs-Workflow einen Write Data Node, um neue Benutzer in diese Tabelle einzufügen
- Verwenden Sie einen Query Data Node, um Benutzer beim Login per E-Mail nachzuschlagen
Alle Daten werden persistent in Ubex gespeichert und stehen allen Workflows im Workspace zur Verfügung.
Wann Ubex-Tabellen vs. eine externe Datenbank verwenden
| Anwendungsfall | Empfehlung |
|---|---|
| Prototyping und MVPs | Ubex-Tabellen – schnell einzurichten, keine Konfiguration nötig |
| Kleine bis mittlere Datensätze | Ubex-Tabellen – integrierte Indizierung und RAG-Unterstützung |
| Große Produktionsdaten | External Database Node – Verbindung zu PostgreSQL, MySQL usw. |
| Bestehende Datenbank, die abgefragt werden muss | External Database Node |
Datenquellen in Workflows verwenden
Einmal erstellt, stehen Datenquellen in Ihren gesamten Workflows zur Verfügung:
- Query Data Node – Zeilen aus einer Tabelle lesen, nach Spaltenwerten filtern, Ergebnisse sortieren und die Anzahl der zurückgegebenen Zeilen begrenzen.
- Write Data Node – Neue Zeilen einfügen, bestehende Zeilen aktualisieren (Upsert) oder Zeilen aus einer Tabelle löschen. Workflow-Variablen auf Tabellenspalten abbilden.
- Model Node (RAG) – PDF-, Web-Scraper-, Raw-Text- oder RAG-fähige Tabellen-Datenquellen an einen Model Node anhängen. Das Modell führt eine semantische Suche über den indizierten Inhalt durch und verwendet die Ergebnisse als Kontext für seine Antwort.
Query Data vs. RAG
| Merkmal | Query Data (Table) | RAG (Beliebige Datenquelle) |
|---|---|---|
| Suchtyp | Exakte Filter auf Spaltenwerte | Semantische Ähnlichkeitssuche |
| Am besten für | Strukturierte Abfragen (Benutzer per E-Mail finden, Konfigurationswert abrufen) | Natürlichsprachliche Fragen über Dokumente oder Wissensdatenbanken |
| Gibt zurück | Zeilen, die Ihren Filtern entsprechen | Top-K relevanteste Text-Chunks |
| Verwendet in | Query Data Node | Model Node mit angehängten Datenquellen |
Datenquellen verwalten
Bearbeiten
Klicken Sie auf das Zahnrad-Symbol einer Datenquellenkarte, um deren Einstellungen zu öffnen. Von dort aus können Sie:
- Die Datenquelle umbenennen
- Die Beschreibung aktualisieren
- Für Tabellen: Spalten hinzufügen, entfernen oder ändern und Zeilen verwalten
- Für PDF / Text / Web: Inhalte erneut hochladen oder die Quelle aktualisieren
- Die Datenquelle löschen
Status
| Status | Bedeutung |
|---|---|
| Ready | Die Datenquelle ist indiziert und für Abfragen verfügbar |
| Busy | Die Datenquelle wird verarbeitet (Hochladen, Scraping oder Neuindizierung) |
Datenquellen im Status Busy können weiterhin in Workflows referenziert werden, aber Abfragen können unvollständige Ergebnisse liefern, bis die Verarbeitung abgeschlossen ist.