
Sistem RAG Cerdas dengan n8n: Eksperimen Agentic RAG
Eksperimen membangun sistem Agentic RAG menggunakan n8n dengan kombinasi Gemini AI dan Deepseek AI. Sistem ini mampu memutuskan sendiri kapan menggunakan semantic search, SQL query, atau full document retrieval untuk memberikan respons yang akurat.
Membangun Sistem RAG Cerdas dengan n8n: Eksperimen Agentic RAG π
Pernahkah temen-temen membayangkan memiliki asisten AI yang tidak hanya bisa mencari dokumen, tetapi juga bisa memutuskan kapan harus melakukan perhitungan SQL atau semantic search? Dalam eksperimen kali ini, saya akan berbagi pengalaman membangun sistem Agentic RAG menggunakan n8n yang bisa βberpikirβ dan mengambil keputusan cerdas.
π οΈ Stack Teknologi yang Digunakan
Proyek ini dimulai dari template yang dibuat oleh Cole Medin yang kemudian saya modifikasi agar kompatibel dengan model AI yang saya miliki. Template asli menggunakan kombinasi teknologi yang menarik:
- n8n - Sebagai workflow automation engine
- Google Drive (OAuth2) - Storage untuk dokumen
- Supabase
- PostgreSQL untuk database relasional
- Vector Database untuk semantic search
- Gemini AI (free tier, model gemini-2.0-flash-001)
- Deepseek AI (paid, model deepseek-reasoner)
Yang menarik dari setup ini adalah saya sengaja tidak menggunakan OpenAI karena tidak memiliki akun berbayar, dan ternyata kombinasi Gemini + Deepseek memberikan hasil yang cukup memuaskan untuk temen-temen yang budget-conscious!
π§ Mengapa Agentic RAG Berbeda?
Berbeda dengan RAG tradisional yang hanya melakukan pencarian sederhana, sistem Agentic RAG ini memiliki kemampuan reasoning - bisa memutuskan sendiri strategi terbaik untuk menjawab pertanyaan:
- Vector Database: Optimal untuk semantic search dan pencarian kontekstual
- SQL Query: Ideal untuk perhitungan matematis dan analisis data tabular
- Full Document Retrieval: Ketika butuh konteks lengkap dokumen
πͺ Tantangan Teknis dan Solusinya
1. Resource Terbatas, Hasil Maksimal
Saya menjalankan n8n di spesifikasi yang sangat terbatas:
- 512MB RAM
- 0.5 Core vCPU
- Platform: Claw Cloud Run
Meskipun kadang mengalami OOM (Out of Memory), sistem tetap bisa berjalan dengan baik untuk sebagian besar use case.

2. Penyesuaian Vector Embedding
Salah satu tantangan teknis yang menarik adalah perbedaan ukuran vector embedding:
- Template asli menggunakan OpenAI embedding (1568 dimensi)
- Saya menggunakan Gemini embedding (768 dimensi)
Solusinya adalah menyesuaikan konfigurasi vector database di Supabase agar kompatibel.

3. Format Dokumen Kompleks
Dokumen Word dengan format kompleks (tabel, gambar, dll.) kadang menyebabkan error saat parsing. Solusinya adalah preprocessing dokumen untuk memastikan format yang clean.

π¬ Hasil Eksperimen
Gemini AI (Free Tier)
- Kemampuan: Bisa membaca dan memahami dokumen dengan baik
- Kelemahan: Prompt engineering sangat berpengaruh
- Kelebihan: Gratis dan cukup akurat untuk use case sederhana
Contoh: Ketika diminta analisis dari dokumen, Gemini butuh beberapa kali iterasi untuk memberikan jawaban yang akurat.

Deepseek AI (Paid)
- Kemampuan: Langsung akurat dalam perhitungan
- Hasil: Berhasil menghitung total vCPU = 146 dengan tepat dalam sekali percobaan
- Kelebihan: Lebih reliable untuk analisis numerik

Token yang Terpakai Saat Menanyakan Total vCPU

π Format File yang Didukung
Sistem ini mendukung 4 jenis file:
- PDF - Ekstraksi teks dengan OCR
- Excel/XLSX - Parsing data tabular
- CSV - Import langsung ke database
- Word/DOCX - Konversi ke teks
Untuk eksperimen ini, saya fokus pada testing dengan:
- PDF (data dummy dari internet)
- Google Docs (naskah ringkasan aplikasi Aether)
- XLSX (data list-instance dari Aether, 1 header + 20 rows)

ποΈ Arsitektur Workflow
Workflow n8n yang saya bangun memiliki flow sebagai berikut:
- Document Ingestion: Upload via Google Drive
- Content Extraction: Parse berbagai format file
- Intelligent Chunking: Pembagian konten yang optimal
- Vector Storage: Simpan embedding di Supabase
- Agentic Query Processing: AI memutuskan strategi pencarian
- Response Generation: Menghasilkan jawaban kontekstual
π‘ Key Learnings
- Model Selection Matters: Deepseek lebih akurat untuk perhitungan, Gemini bagus untuk pemahaman konteks
- Resource Optimization: Sistem bisa berjalan di spek rendah dengan optimasi yang tepat
- Prompt Engineering: Sangat kritikal, terutama untuk model free tier
- Data Quality: Input yang bersih menghasilkan output yang lebih akurat
π Whatβs Next?
Eksperimen ini membuka banyak kemungkinan untuk pengembangan lebih lanjut:
- Optimasi Performance: Meningkatkan efisiensi memory usage
- Multi-Modal Support: Menambah dukungan untuk gambar dan audio
- Advanced RAG Techniques: Implementing hierarchical retrieval
- Local Deployment: Versi yang bisa dijalankan secara offline
π― Kesimpulan
Agentic RAG dengan n8n terbukti sangat powerful untuk membangun sistem knowledge management yang cerdas. Meskipun ada tantangan teknis, kombinasi tools yang tepat dan strategi yang baik bisa menghasilkan sistem yang robust dan cost-effective.
Yang paling menarik adalah kemampuan sistem untuk βberpikirβ dan memilih strategi yang tepat - apakah perlu semantic search, SQL query, atau full document retrieval. Ini adalah langkah signifikan menuju AI yang lebih intelligent dan practical untuk kebutuhan temen-temen semua.
Sumber Bacaan Lainnya Tentang Agentic RAG
Tertarik mencoba? Template n8n versi yang sudah saya modifikasi tersedia di GitHub repository ini, bisa disesuaikan dengan kebutuhan temen-temen. Happy experimenting! π€
Credit: Template asli dibuat oleh Cole Medin - terima kasih atas inspirasi dan foundation yang luar biasa!