فن آوران گیتی افروز
متوسطHybridفارسی

LLM Engineering — از RAG و Fine-tuning تا Production

ساخت سیستم‌های LLM واقعی برای production — نه دموی یک‌بار مصرف

مدت
10 هفته
ساعت
75 ساعت
ثبت‌نام
+13
شروع
۲۰ مرداد ۱۴۰۵
فقط 9 صندلی باقی مانده در این کوهورت
متخصصان دانش‌آموخته در:
دوره با هدف استخدام — جذب و همکاری پس از اتمام دوره
Snapp PayDigikalaTapsiCafe BazaarMellat BankPasargad FintechOkala
What you'll be able to do

دستاوردهای پایان دوره

این دوره ده هفته‌ای، شما را از سطح prompt engineering ساده به مهندس LLM می‌رساند که می‌تواند یک سیستم RAG production-grade طراحی، fine-tune، evaluate و deploy کند. تمرکز روی مسائلی است که در شرکت‌های ایرانی و فارسی‌زبان واقعاً پیش می‌آید: کیفیت پایین embedding برای متن فارسی، hallucination، prompt injection، هزینه‌ی بالای inference، نبود eval suite، و عدم observability. در هر هفته یک lab عملی روی یک stack واقعی (vLLM, LangGraph, Promptfoo, Langfuse, BGE-fa) خواهید داشت و در پایان دوره یک پروژه‌ی capstone قابل ارائه به کارفرما تحویل می‌دهید. این دوره برای کسی است که نمی‌خواهد فقط API بزند، بلکه می‌خواهد بفهمد زیر کاپوت چه می‌گذرد و سیستم را در مقیاس بسازد.

این دوره برای کیست؟
  • ML/AI Engineer که می‌خواهد از مدل‌سازی کلاسیک به LLM Engineering مهاجرت کند
  • Backend Senior که می‌خواهد در محصول AI کار کند و معماری LLM یاد بگیرد
  • Data Scientist که از notebook فراتر می‌رود و سیستم production می‌سازد
  • Tech Lead AI product که باید تیم LLM را هدایت و معماری انتخاب کند
  • Founder فنی استارتاپ AI که محصول مبتنی بر LLM می‌سازد
  • DevOps/MLOps Engineer که مسئول serving و monitoring مدل‌های زبانی است
01

ساخت RAG production-grade با retrieval reranking و hybrid search

02

Fine-tuning مدل‌های open-source با LoRA و QLoRA روی GPU محدود

03

طراحی Eval suite با LLM-as-judge و golden set برای regression testing

04

پیاده‌سازی Guardrails برای Prompt Injection، PII و hallucination detection

05

Persian embedding tuning و بهبود کیفیت retrieval برای متن فارسی

06

Deploy مدل با vLLM و TensorRT-LLM با throughput بالا و latency پایین

07

ساخت Agent با function calling، tools و multi-step planning با LangGraph

08

Cost optimization — caching، routing، quantization و prompt compression

09

Observability کامل با Langfuse — trace، cost tracking، quality metrics

10

طراحی dataset curation pipeline برای fine-tuning و eval

مهارت‌هایی که می‌سازی
RAG (Retrieval-Augmented Generation)Fine-tuning با LoRA و QLoRAvLLM برای serving با throughput بالاTensorRT-LLM برای optimization روی GPULangGraph برای orchestration agentهاMCP (Model Context Protocol)Persian Embeddings با BGE-fa و multilingual-e5Reranking با Cohere و bge-rerankerEval با Promptfoo و BraintrustGuardrails و security hardeningCost optimization و caching strategiesMonitoring و observability با Langfuse
Syllabus

ده هفته از مفاهیم پایه تا یک سیستم LLM در production

10 ماژول هفتگی · هر هفته ~8 ساعت ترکیبی از ویدئو + lab زنده + پروژه عملی.

هفته ۱
Foundations — Transformer Revisited و Scaling Laws
۷ ساعت
  • مرور دقیق معماری transformer از زاویه‌ی مهندسی
  • Attention، KV cache و چرا روی latency اثر دارد
  • Tokenization — BPE، SentencePiece و چالش‌های فارسی
  • Scaling laws — Chinchilla، Kaplan و درس‌هایی برای انتخاب مدل
  • مرور خانواده‌های مدل: Llama، Qwen، Mistral، DeepSeek، Aya
Lab عملی:اجرای یک مدل ۷B با llama.cpp و اندازه‌گیری دقیق latency و throughput
هفته ۲
Prompt Engineering در سطح Production
۷ ساعت
  • تفاوت prompt دمو و prompt محصول
  • Structured output با JSON mode و function calling
  • Few-shot، CoT و self-consistency در عمل
  • Prompt versioning، A/B test و rollback
  • Template engineering با Jinja و مدیریت زبان فارسی
Lab عملی:ساخت prompt registry با versioning و اتصال به CI
هفته ۳
RAG Basics — Chunking، Embeddings و Retrieval
۸ ساعت
  • آناتومی یک سیستم RAG و نقاط شکست رایج
  • Chunking strategies — fixed، recursive، semantic، document-aware
  • Embedding models و معیارهای انتخاب برای فارسی
  • Vector DBها — Qdrant، Weaviate، pgvector و trade-offs
  • Metadata filtering و hybrid metadata
Lab عملی:ساخت RAG اولیه روی مجموعه‌ی اسناد فارسی با Qdrant و BGE-fa
هفته ۴
RAG Advanced — Reranking، Hybrid Search و Query Rewriting
۸ ساعت
  • Hybrid search — BM25 + dense و وزن‌دهی RRF
  • Reranking با cross-encoder و bge-reranker-v2
  • Query rewriting، HyDE و multi-query
  • Parent-child و small-to-big retrieval
  • Evaluation retrieval با Recall@k و MRR
Lab عملی:ارتقای RAG هفته‌ی قبل با reranker و hybrid search و اندازه‌گیری بهبود
هفته ۵
Fine-tuning — LoRA، QLoRA و Dataset Curation
۹ ساعت
  • تفاوت SFT، DPO و RLHF و کِی کدام را انتخاب کنیم
  • LoRA و QLoRA — ریاضیات و trade-off حافظه/کیفیت
  • Dataset curation — کیفیت بر کمیت، deduplication، filtering
  • Training با Unsloth و axolotl روی یک GPU
  • Merge، quantize و آماده‌سازی برای serving
Lab عملی:Fine-tune یک مدل ۷B فارسی با QLoRA روی dataset سفارشی
هفته ۶
Evaluation — LLM-as-Judge، Golden Sets و Regression Testing
۸ ساعت
  • چرا eval سخت‌ترین بخش LLM engineering است
  • ساخت golden set و معیارهای کیفیت
  • LLM-as-judge — pairwise، rubric-based، bias mitigation
  • Eval framework با Promptfoo و Braintrust
  • اتصال eval به CI و جلوگیری از regression
Lab عملی:ساخت eval suite کامل با ۱۰۰ سؤال طلایی برای RAG هفته‌ی ۴
هفته ۷
Guardrails — Prompt Injection، PII و Hallucination
۷ ساعت
  • تاکسونومی حملات — prompt injection، jailbreak، data exfiltration
  • دفاع‌های لایه‌ای — input/output filtering، sandboxing
  • PII detection و redaction در ورودی و خروجی
  • Hallucination detection — groundedness و citation checking
  • Policy enforcement با NeMo Guardrails و Llama Guard
Lab عملی:افزودن لایه‌ی guardrail کامل به RAG و تست با ۳۰ حمله‌ی شناخته‌شده
هفته ۸
Agents — Function Calling، Tools و Multi-step Planning
۸ ساعت
  • تفاوت chain، agent و workflow
  • Function calling — schema design و error handling
  • Tool use با MCP و استانداردسازی tools
  • Planning، reflection و self-correction
  • LangGraph — state machine برای agentهای پایدار
Lab عملی:ساخت agent با ۴ tool (SQL، web search، calculator، RAG) با LangGraph
هفته ۹
Production — vLLM، TensorRT-LLM، Caching و Observability
۸ ساعت
  • Serving با vLLM و paged attention
  • TensorRT-LLM — quantization و کاهش latency
  • Semantic cache و prompt cache برای کاهش هزینه
  • Routing بین مدل‌های مختلف بر اساس پیچیدگی
  • Observability کامل با Langfuse — trace، cost، quality
Lab عملی:Deploy یک مدل ۷B fine-tuned با vLLM پشت Nginx با Langfuse integration
هفته ۱۰
Capstone — Production RAG با Eval و Monitoring
۵ ساعت
  • طراحی معماری end-to-end برای یک use case واقعی
  • ادغام همه‌ی لایه‌ها — RAG، guardrail، eval، monitoring
  • Load testing و capacity planning
  • Cost report و SLO تعریف
  • ارائه‌ی نهایی و code review توسط مدرسین
Lab عملی:تحویل پروژه‌ی capstone با README، eval report و demo زنده
Hands-on Projects

پروژه‌هایی که در رزومه‌تان می‌نشینند

هر پروژه با code review توسط مربی، در پایان به یک portfolio repository خصوصی شما اضافه می‌شود — برای نشان دادن به کارفرما.

#01

RAG چندنوع داده — PDF، SQL، API

ساخت یک سیستم RAG که هم‌زمان روی مجموعه‌ای از PDFهای فارسی، یک دیتابیس PostgreSQL با schema پیچیده، و یک REST API خارجی کار می‌کند. سیستم باید بتواند منبع پاسخ را تشخیص دهد، query را به مسیر درست route کند و پاسخ نهایی را با citation تحویل دهد.

RAGHybrid RetrievalRoutingCitationPersian Embeddings
#02

Agent با چند Tool و Planning

ساخت یک agent با LangGraph که حداقل چهار tool دارد (SQL query، web search، file system، calculator) و می‌تواند task چندمرحله‌ای را planning کند، خطاها را تشخیص دهد و reflection داشته باشد. agent باید با MCP استاندارد شود و قابل استفاده در Claude Desktop باشد.

LangGraphFunction CallingMCPPlanningTool Use
#03

Fine-tune مدل ۷B برای دامنه‌ی خاص

انتخاب یک دامنه (حقوقی، پزشکی، فنی یا مالی)، curation یک dataset با کیفیت بالا، fine-tune یک مدل ۷B با QLoRA، quantization و serving با vLLM. تحویل شامل eval report کامل با مقایسه‌ی baseline و مدل fine-tuned است.

QLoRADataset CurationvLLMEvaluationQuantization
Authority — Meet Your Instructors

مدرس‌های دوره

مر

مهندس رضا استادی

بنیان‌گذار آکادمی GITA و مدرس مهندسی LLM

مهندس رضا استادی بنیان‌گذار آکادمی GITA و مدرس این دوره است. او با بیش از ۱۵ سال تجربه‌ی عملی در طراحی سامانه‌های مبتنی بر LLM و RAG در مقیاس Production، تیم‌های فنی متعددی را در سازمان‌های بزرگ کشور راهبری کرده و تمرکز او بر انتقال تجربه‌ی واقعی میدانی به زبان ساده و کاربردی است.

بنیان‌گذار و مدیر آکادمی GITAبیش از ۱۵ سال تجربه‌ی مهندسی و راهبری تیم‌های فنیمشاور و مدرس سازمانی در صنایع بانکی، تلکام و انرژیسخنران و مدرس ده‌ها کارگاه و دوره‌ی تخصصی
CERTIFICATE OF COMPLETION
LLM Eng
صادره از آکادمی گیتی‌افروز
Recognition

گواهینامه‌ی قابل ارائه به کارفرما

در پایان دوره گواهینامه‌ای صادر می‌شود که با QR قابل تأیید بوده و به Linkedin، رزومه و پورتفولیو شما اضافه می‌شود.

تأییدشده توسط شورای صنفی AI Engineers ایران
قابل ارائه به کارفرمایان داخلی و بین‌المللی
شامل لینک verifiable و QR code برای راستی‌آزمایی
Social Proof

از دانشجویان کوهورت‌های قبلی

بعد از این دوره تونستم در شرکتمون یک RAG واقعی روی ۲۰۰ هزار سند فارسی بسازم که تیم حقوقی روزانه ازش استفاده می‌کنه. تفاوت با تجربه‌ی قبلیم با LangChain ساده زمین تا آسمونه.
نیما محمدی
Senior ML Engineer در یک fintech · Cohort بهار ۱۴۰۵
بخش fine-tuning و QLoRA دقیقاً همون چیزی بود که دنبالش بودم. تونستم یک مدل ۷B رو روی یک RTX 4090 fine-tune کنم و در production استفاده کنم. هزینه‌ی API رو ۷۰٪ کاهش دادیم.
سارا کریمی
AI Lead در یک scale-up سلامت · Cohort زمستان ۱۴۰۴
تأکید دوره روی eval و guardrail چیزی بود که هیچ‌جای دیگه به این عمق ندیدم. حالا قبل از هر deploy یک eval suite کامل داریم و regression رو سریع تشخیص میدیم.
علی حسینی
Tech Lead AI در یک e-commerce · Cohort پاییز ۱۴۰۴
مدرسین واقعاً production زده بودن، نه فقط tutorial دیده باشن. هر سؤالی می‌پرسیدیم با مثال واقعی از یک سیستم در مقیاس جواب می‌دادن. لب‌ها هم به‌شدت چالشی بود.
زهرا اکبری
Data Scientist در یک بانک · Cohort بهار ۱۴۰۵
بخش Persian embedding tuning برای من که روی محصول فارسی کار می‌کنم طلا بود. کیفیت retrievalمون با تکنیک‌هایی که یاد گرفتم سه برابر شد.
محمد طاهری
Backend Engineer در یک LegalTech · Cohort زمستان ۱۴۰۴
Capstone واقعاً یک پروژه‌ی قابل ارائه به کارفرما بود. الان توی portfolioم گذاشتم و توی دو مصاحبه کمکم کرد آفر بگیرم.
پویا صادقی
ML Engineer (تازه ارتقا یافته به Senior) · Cohort پاییز ۱۴۰۴
Reserve Your Seat

پیش‌ثبت‌نام کوهورت

پیش‌ثبت‌نام بدون پرداخت — پس از مصاحبه‌ی ورودی نهایی می‌شود.

Cohort پاییز ۱۴۰۵ — ظرفیت محدود
پیش‌ثبت‌نامبدون پرداخت
شهریه‌ی دوره پس از مصاحبه‌ی ورودی و نهایی‌شدن کوهورت به‌صورت اختصاصی اعلام می‌شود.
همه‌ی ویدئوها به‌صورت دائمی
Slack اختصاصی کوهورت
Office hours هفتگی با مربی
Code review پروژه‌ها
گواهینامه‌ی رسمی + Linkedin
معرفی به شرکت‌های همکار برای استخدام
پیش‌ثبت‌نام رایگان — صندلی‌ام را نگه دار

بدون پرداخت در این مرحله. تیم ما طی ۲۴ ساعت برای مصاحبه‌ی ورودی تماس می‌گیرد.

پلن سازمانی
بسته‌ی سازمانی برای ۳ نفر به بالا با ۲۰٪ تخفیف و فاکتور رسمی
درخواست پیشنهاد
Objection Handling

سؤال‌های متداول

01آیا بدون GPU شخصی می‌توانم در دوره شرکت کنم؟

بله. برای لب‌های fine-tuning و serving، اعتبار رایگان روی Runpod و Vast.ai در اختیار شما قرار می‌گیرد. برای مابقی لب‌ها یک GPU متوسط در colab pro کافی است.

02تفاوت این دوره با دوره‌های LangChain و LlamaIndex چیست؟

تمرکز این دوره روی مهندسی و production است نه روی یک framework خاص. ما از LangGraph، Promptfoo، Langfuse و vLLM استفاده می‌کنیم اما اصول را طوری آموزش می‌دهیم که با هر framework دیگری هم قابل اعمال باشد.

03آیا روی مدل‌های closed source مثل GPT و Claude هم کار می‌کنیم؟

بله. در بخش prompt engineering، agentها و guardrail با هر دو خانواده‌ی open و closed کار می‌کنیم. در fine-tuning و serving طبیعتاً تمرکز روی open-source است.

04زبان دوره فارسی است اما منابع چطور؟

تدریس و پشتیبانی کاملاً فارسی است. اسلایدها bilingual هستند و منابع تکمیلی (مقالات و مستندات) عمدتاً انگلیسی‌اند. توانایی خواندن متن فنی انگلیسی الزامی است.

05اگر یک جلسه را از دست بدهم چه می‌شود؟

تمام جلسات ضبط می‌شوند و تا ۱۲ ماه در دسترس شما هستند. علاوه بر آن یک office hour هفتگی برای جبران و رفع اشکال وجود دارد.

06آیا گواهی پایان دوره معتبر است؟

گواهی شامل QR code و لینک verifiable است و توسط کارفرمایان داخلی پذیرفته می‌شود. برای کارفرمای خارجی، نمونه‌ی پروژه‌ی capstone و repo شخصی شما معمولاً وزن بیشتری دارد که در دوره به آن می‌پردازیم.

07تخفیف دانشجویی یا سازمانی دارید؟

بله. ۲۰٪ تخفیف دانشجویی با ارائه‌ی کارت دانشجویی معتبر، و ۲۰٪ تخفیف سازمانی برای ۳ نفر به بالا با فاکتور رسمی.

08اگر بعد از دوره سؤال یا چالش جدید داشتم چه؟

تا ۶ ماه پس از پایان دوره به یک کانال اختصاصی دسترسی دارید و یک جلسه‌ی mentorship ۴۵ دقیقه‌ای رایگان با یکی از مدرسین می‌توانید رزرو کنید.

09آیا امکان بازگشت وجه وجود دارد؟

تا قبل از شروع هفته‌ی دوم، ۸۰٪ مبلغ قابل بازگشت است. پس از آن به دلیل ماهیت cohort-based دوره، بازگشت وجه ممکن نیست اما می‌توانید جای خود را به cohort بعدی منتقل کنید.

10آیا این دوره برای founder غیرفنی مناسب است؟

خیر. این دوره فنی و عملی است و پیش‌نیاز Python پیشرفته و آشنایی با ML الزامی است. برای founderها دوره‌ی جداگانه‌ای با عنوان «استراتژی محصول AI» داریم.

11آیا روی مدل‌های فارسی خاص (مثل Aya و Maral) هم کار می‌کنیم؟

بله. در هفته‌های ۳ و ۵ به‌طور خاص با Aya-23، Maral و فاینال‌سازی روی BGE-fa کار می‌کنیم و کیفیت آنها را روی benchmark فارسی مقایسه می‌کنیم.

12بعد از دوره چه مسیرهای شغلی باز می‌شود؟

خروجی‌های دوره‌های قبلی در نقش‌هایی مثل LLM Engineer، AI Solutions Architect، MLOps for LLMs و Founding AI Engineer در استارتاپ‌های ایرانی و خارجی مشغول به کار شده‌اند. یک جلسه‌ی career coaching هم در پایان دوره داریم.

پیش‌ثبت‌نام در ۶۰ ثانیه

فقط نام و راه ارتباطی — تیم ما طی ۲۴ ساعت با شما تماس می‌گیرد، مصاحبه‌ی ورودی می‌گذارد و در صورت تطابق صندلی برایتان نگه می‌داریم.

بدون پرداخت در این مرحله
معرفی به شرکت‌های همکار برای استخدام پس از دوره
سند Syllabus PDF رایگان

با ارسال، با شرایط استفاده موافقت می‌کنید.

شروع کوهورت
۲۰ مرداد ۱۴۰۵ · 9 صندلی
ثبت‌نام