Sistem RAG Cerdas dengan n8n: Eksperimen Agentic RAG

Sistem RAG Cerdas dengan n8n: Eksperimen Agentic RAG

6 min read
723 wordsTechnology
ain8nagentic-raggeminideepseeksupabase

Eksperimen membangun sistem Agentic RAG menggunakan n8n dengan kombinasi Gemini AI dan Deepseek AI. Sistem ini mampu memutuskan sendiri kapan menggunakan semantic search, SQL query, atau full document retrieval untuk memberikan respons yang akurat.

Membangun Sistem RAG Cerdas dengan n8n: Eksperimen Agentic RAG πŸš€

Pernahkah temen-temen membayangkan memiliki asisten AI yang tidak hanya bisa mencari dokumen, tetapi juga bisa memutuskan kapan harus melakukan perhitungan SQL atau semantic search? Dalam eksperimen kali ini, saya akan berbagi pengalaman membangun sistem Agentic RAG menggunakan n8n yang bisa β€œberpikir” dan mengambil keputusan cerdas.

πŸ› οΈ Stack Teknologi yang Digunakan

Proyek ini dimulai dari template yang dibuat oleh Cole Medin yang kemudian saya modifikasi agar kompatibel dengan model AI yang saya miliki. Template asli menggunakan kombinasi teknologi yang menarik:

  • n8n - Sebagai workflow automation engine
  • Google Drive (OAuth2) - Storage untuk dokumen
  • Supabase
    • PostgreSQL untuk database relasional
    • Vector Database untuk semantic search
  • Gemini AI (free tier, model gemini-2.0-flash-001)
  • Deepseek AI (paid, model deepseek-reasoner)

Yang menarik dari setup ini adalah saya sengaja tidak menggunakan OpenAI karena tidak memiliki akun berbayar, dan ternyata kombinasi Gemini + Deepseek memberikan hasil yang cukup memuaskan untuk temen-temen yang budget-conscious!

🧠 Mengapa Agentic RAG Berbeda?

Berbeda dengan RAG tradisional yang hanya melakukan pencarian sederhana, sistem Agentic RAG ini memiliki kemampuan reasoning - bisa memutuskan sendiri strategi terbaik untuk menjawab pertanyaan:

  • Vector Database: Optimal untuk semantic search dan pencarian kontekstual
  • SQL Query: Ideal untuk perhitungan matematis dan analisis data tabular
  • Full Document Retrieval: Ketika butuh konteks lengkap dokumen

πŸ’ͺ Tantangan Teknis dan Solusinya

1. Resource Terbatas, Hasil Maksimal

Saya menjalankan n8n di spesifikasi yang sangat terbatas:

  • 512MB RAM
  • 0.5 Core vCPU
  • Platform: Claw Cloud Run

Meskipun kadang mengalami OOM (Out of Memory), sistem tetap bisa berjalan dengan baik untuk sebagian besar use case. agentic-rag-oom.webp

2. Penyesuaian Vector Embedding

Salah satu tantangan teknis yang menarik adalah perbedaan ukuran vector embedding:

  • Template asli menggunakan OpenAI embedding (1568 dimensi)
  • Saya menggunakan Gemini embedding (768 dimensi)

Solusinya adalah menyesuaikan konfigurasi vector database di Supabase agar kompatibel. vector-embedding-size-google.webp

3. Format Dokumen Kompleks

Dokumen Word dengan format kompleks (tabel, gambar, dll.) kadang menyebabkan error saat parsing. Solusinya adalah preprocessing dokumen untuk memastikan format yang clean. agentic-rag-error-insert-vector.webp

πŸ”¬ Hasil Eksperimen

Gemini AI (Free Tier)

  • Kemampuan: Bisa membaca dan memahami dokumen dengan baik
  • Kelemahan: Prompt engineering sangat berpengaruh
  • Kelebihan: Gratis dan cukup akurat untuk use case sederhana

Contoh: Ketika diminta analisis dari dokumen, Gemini butuh beberapa kali iterasi untuk memberikan jawaban yang akurat.

agentic-rag-google-itteration.webp agentic-rag-grafana2.webp agentic-rag-grafana1.webp

Deepseek AI (Paid)

  • Kemampuan: Langsung akurat dalam perhitungan
  • Hasil: Berhasil menghitung total vCPU = 146 dengan tepat dalam sekali percobaan
  • Kelebihan: Lebih reliable untuk analisis numerik

agentic-rag-deepseek-vcpu.webp agentic-rag-deepseek-reasoning.webp

Token yang Terpakai Saat Menanyakan Total vCPU

agentic-rag-deepseek-token.webp

πŸ“Š Format File yang Didukung

Sistem ini mendukung 4 jenis file:

  1. PDF - Ekstraksi teks dengan OCR
  2. Excel/XLSX - Parsing data tabular
  3. CSV - Import langsung ke database
  4. Word/DOCX - Konversi ke teks

Untuk eksperimen ini, saya fokus pada testing dengan:

  • PDF (data dummy dari internet)
  • Google Docs (naskah ringkasan aplikasi Aether)
  • XLSX (data list-instance dari Aether, 1 header + 20 rows)

agentic-rag-gdrive.webp

πŸ—οΈ Arsitektur Workflow

Workflow n8n yang saya bangun memiliki flow sebagai berikut:

  1. Document Ingestion: Upload via Google Drive
  2. Content Extraction: Parse berbagai format file
  3. Intelligent Chunking: Pembagian konten yang optimal
  4. Vector Storage: Simpan embedding di Supabase
  5. Agentic Query Processing: AI memutuskan strategi pencarian
  6. Response Generation: Menghasilkan jawaban kontekstual

πŸ’‘ Key Learnings

  1. Model Selection Matters: Deepseek lebih akurat untuk perhitungan, Gemini bagus untuk pemahaman konteks
  2. Resource Optimization: Sistem bisa berjalan di spek rendah dengan optimasi yang tepat
  3. Prompt Engineering: Sangat kritikal, terutama untuk model free tier
  4. Data Quality: Input yang bersih menghasilkan output yang lebih akurat

πŸš€ What’s Next?

Eksperimen ini membuka banyak kemungkinan untuk pengembangan lebih lanjut:

  • Optimasi Performance: Meningkatkan efisiensi memory usage
  • Multi-Modal Support: Menambah dukungan untuk gambar dan audio
  • Advanced RAG Techniques: Implementing hierarchical retrieval
  • Local Deployment: Versi yang bisa dijalankan secara offline

🎯 Kesimpulan

Agentic RAG dengan n8n terbukti sangat powerful untuk membangun sistem knowledge management yang cerdas. Meskipun ada tantangan teknis, kombinasi tools yang tepat dan strategi yang baik bisa menghasilkan sistem yang robust dan cost-effective.

Yang paling menarik adalah kemampuan sistem untuk β€œberpikir” dan memilih strategi yang tepat - apakah perlu semantic search, SQL query, atau full document retrieval. Ini adalah langkah signifikan menuju AI yang lebih intelligent dan practical untuk kebutuhan temen-temen semua.

Sumber Bacaan Lainnya Tentang Agentic RAG


Tertarik mencoba? Template n8n versi yang sudah saya modifikasi tersedia di GitHub repository ini, bisa disesuaikan dengan kebutuhan temen-temen. Happy experimenting! πŸ€–

Credit: Template asli dibuat oleh Cole Medin - terima kasih atas inspirasi dan foundation yang luar biasa!

Written by Minh Phu Pham

Published on June 26, 2025

Share this article:

Β© 2025 | Minh Phu Pham. All rights reserved.