1 Mio. Dokumente.
Eine Suche.
Triple-Hybrid Search aus FTS5, RAG und semantischer Suche — in 8 Phasen vom Prototyp zur produktionsreifen Enterprise-Lösung. 23 Lib-Module, 14 MCP-Tools, Windows-ACL-Integration und sub-100ms-Suchzeit über 1 Million Dokumente.

Commit-Intensität
127 Commits über 6 Monate Implementierung
Die Evolution
8 Phasen — von der Idee aus realen Kundenprojekten bis zur modularen Enterprise-Architektur.

Die Idee
Erfahrene Mitarbeiter gehen in Rente, ihr Wissen steckt in tausenden Dokumenten. Die Windows-Suche bleibt mühselig bis unmöglich. Aus dieser realen Kunden-Situation entsteht die Anforderung an eine intelligente Wissenssuche, die Synonyme versteht und in Millisekunden antwortet.

Genesis
MCP-Server-Architektur, OAuth 2.0, FTS5-Volltextsuche, Multi-User-Support. Solide Basis für PDF, Word und Excel — pro Sekunde rund 50 Dokumente indexiert, Suche unter einer halben Sekunde.

Genesis
MCP-Server-Architektur, OAuth 2.0, FTS5-Volltextsuche, Multi-User-Support. Solide Basis für PDF, Word und Excel — pro Sekunde rund 50 Dokumente indexiert, Suche unter einer halben Sekunde.

Enterprise Security
Windows-ACL-Integration mit Multi-Share-Support, Tesseract OCR für gescannte PDFs, DSGVO Audit-Logging und Two-Layer Security. Acht Entwicklungsphasen allein für die robuste Berechtigungs-Schicht.

RAG Integration
Semantic Search via Vector Embeddings, Document Chunking, Hybrid Search (FTS5 + RAG), Ollama-Integration, Background Indexing. Erstmals findet die Suche 'Endpoint Protection', wenn jemand 'Virenschutz' eintippt.

RAG Integration
Semantic Search via Vector Embeddings, Document Chunking, Hybrid Search (FTS5 + RAG), Ollama-Integration, Background Indexing. Erstmals findet die Suche 'Endpoint Protection', wenn jemand 'Virenschutz' eintippt.

Production Ready
Docker-Hub-Publishing, Qdrant Vector Database, Ansible One-Command-Deployment, OpenWebUI-Integration, Claude 4.5 Sonnet Support. Erstes Produktiv-Deployment beim Kunden — 260 Dokumente pro Minute, Suche unter 150ms.

Performance
Multi-Threading mit 4 parallelen Workers, Batch Embeddings (100 concurrent), Queue-basierte Verarbeitung, External-GPU-Optimierung. 750.000+ Dokumente im Produktiveinsatz — Vollindexierung in 12 Stunden statt zwei Tagen.

Performance
Multi-Threading mit 4 parallelen Workers, Batch Embeddings (100 concurrent), Queue-basierte Verarbeitung, External-GPU-Optimierung. 750.000+ Dokumente im Produktiveinsatz — Vollindexierung in 12 Stunden statt zwei Tagen.

ACL-Fingerprinting
Eigene Fingerprinting-Engine erkennt wiederkehrende Berechtigungsmuster über Millionen ACLs hinweg und reduziert sie auf wenige Tausend Fingerprints — drastisch schnellere Berechtigungsprüfung im laufenden Betrieb.

Enterprise Architecture
Nach Team-Review zehn Security-Patches: JWT-Signatur-Verifikation, SQL-Injection-Prevention, OAuth-Token-Cleanup, PowerShell-Command-Injection-Prevention, Rate-Limiting. Parallel: 21 Lib-Module extrahiert, 101+ Tests, Structured Logging — vom Monolith zur modularen Enterprise-Architektur.

Enterprise Architecture
Nach Team-Review zehn Security-Patches: JWT-Signatur-Verifikation, SQL-Injection-Prevention, OAuth-Token-Cleanup, PowerShell-Command-Injection-Prevention, Rate-Limiting. Parallel: 21 Lib-Module extrahiert, 101+ Tests, Structured Logging — vom Monolith zur modularen Enterprise-Architektur.
Bereit für Ihre Wissensbasis?
FileMaster MCP läuft 100% lokal oder in Ihrer Cloud, ist DSGVO-konform und integriert sich in Claude, OpenWebUI und andere MCP-Clients.
