متوسطHybridفارسی

LLM Engineering — از RAG و Fine-tuning تا Production

Name: LLM Engineering — از RAG و Fine-tuning تا Production
Price: 44000000 IRR
Availability: InStock

ساخت سیستم‌های LLM واقعی برای production — نه دموی یک‌بار مصرف

مدت

10 هفته

ساعت

75 ساعت

ثبت‌نام

+13

شروع

۲۰ مرداد ۱۴۰۵

پیش‌ثبت‌نام دوره

فقط 9 صندلی باقی مانده در این بوت‌کمپ

متخصصان دانش‌آموخته در:

دوره با هدف استخدام — جذب و همکاری پس از اتمام دوره

Snapp PayDigikalaTapsiCafe BazaarMellat BankPasargad FintechOkala

What you'll be able to do

دستاوردهای پایان دوره

این دوره ده هفته‌ای، شما را از سطح prompt engineering ساده به مهندس LLM می‌رساند که می‌تواند یک سیستم RAG production-grade طراحی، fine-tune، evaluate و deploy کند. تمرکز روی مسائلی است که در شرکت‌های ایرانی و فارسی‌زبان واقعاً پیش می‌آید: کیفیت پایین embedding برای متن فارسی، hallucination، prompt injection، هزینه‌ی بالای inference، نبود eval suite، و عدم observability. در هر هفته یک lab عملی روی یک stack واقعی (vLLM, LangGraph, Promptfoo, Langfuse, BGE-fa) خواهید داشت و در پایان دوره یک پروژه‌ی capstone قابل ارائه به کارفرما تحویل می‌دهید. این دوره برای کسی است که نمی‌خواهد فقط API بزند، بلکه می‌خواهد بفهمد زیر کاپوت چه می‌گذرد و سیستم را در مقیاس بسازد.

این دوره برای کیست؟

ML/AI Engineer که می‌خواهد از مدل‌سازی کلاسیک به LLM Engineering مهاجرت کند
Backend Senior که می‌خواهد در محصول AI کار کند و معماری LLM یاد بگیرد
Data Scientist که از notebook فراتر می‌رود و سیستم production می‌سازد
Tech Lead AI product که باید تیم LLM را هدایت و معماری انتخاب کند
Founder فنی استارتاپ AI که محصول مبتنی بر LLM می‌سازد
DevOps/MLOps Engineer که مسئول serving و monitoring مدل‌های زبانی است

ساخت RAG production-grade با retrieval reranking و hybrid search

Fine-tuning مدل‌های open-source با LoRA و QLoRA روی GPU محدود

طراحی Eval suite با LLM-as-judge و golden set برای regression testing

پیاده‌سازی Guardrails برای Prompt Injection، PII و hallucination detection

Persian embedding tuning و بهبود کیفیت retrieval برای متن فارسی

Deploy مدل با vLLM و TensorRT-LLM با throughput بالا و latency پایین

ساخت Agent با function calling، tools و multi-step planning با LangGraph

Cost optimization — caching، routing، quantization و prompt compression

Observability کامل با Langfuse — trace، cost tracking، quality metrics

طراحی dataset curation pipeline برای fine-tuning و eval

مهارت‌هایی که می‌سازی

RAG (Retrieval-Augmented Generation)Fine-tuning با LoRA و QLoRAvLLM برای serving با throughput بالاTensorRT-LLM برای optimization روی GPULangGraph برای orchestration agentهاMCP (Model Context Protocol)Persian Embeddings با BGE-fa و multilingual-e5Reranking با Cohere و bge-rerankerEval با Promptfoo و BraintrustGuardrails و security hardeningCost optimization و caching strategiesMonitoring و observability با Langfuse

Syllabus

ده هفته از مفاهیم پایه تا یک سیستم LLM در production

10 ماژول هفتگی · هر هفته ~8 ساعت ترکیبی از ویدئو + lab زنده + پروژه عملی.

هفته ۱

Foundations — Transformer Revisited و Scaling Laws

۷ ساعت

مرور دقیق معماری transformer از زاویه‌ی مهندسی
Attention، KV cache و چرا روی latency اثر دارد
Tokenization — BPE، SentencePiece و چالش‌های فارسی
Scaling laws — Chinchilla، Kaplan و درس‌هایی برای انتخاب مدل
مرور خانواده‌های مدل: Llama، Qwen، Mistral، DeepSeek، Aya

Lab عملی:اجرای یک مدل ۷B با llama.cpp و اندازه‌گیری دقیق latency و throughput

هفته ۲

Prompt Engineering در سطح Production

۷ ساعت

تفاوت prompt دمو و prompt محصول
Structured output با JSON mode و function calling
Few-shot، CoT و self-consistency در عمل
Prompt versioning، A/B test و rollback
Template engineering با Jinja و مدیریت زبان فارسی

Lab عملی:ساخت prompt registry با versioning و اتصال به CI

هفته ۳

RAG Basics — Chunking، Embeddings و Retrieval

۸ ساعت

آناتومی یک سیستم RAG و نقاط شکست رایج
Chunking strategies — fixed، recursive، semantic، document-aware
Embedding models و معیارهای انتخاب برای فارسی
Vector DBها — Qdrant، Weaviate، pgvector و trade-offs
Metadata filtering و hybrid metadata

Lab عملی:ساخت RAG اولیه روی مجموعه‌ی اسناد فارسی با Qdrant و BGE-fa

هفته ۴

RAG Advanced — Reranking، Hybrid Search و Query Rewriting

۸ ساعت

Hybrid search — BM25 + dense و وزن‌دهی RRF
Reranking با cross-encoder و bge-reranker-v2
Query rewriting، HyDE و multi-query
Parent-child و small-to-big retrieval
Evaluation retrieval با Recall@k و MRR

Lab عملی:ارتقای RAG هفته‌ی قبل با reranker و hybrid search و اندازه‌گیری بهبود

هفته ۵

Fine-tuning — LoRA، QLoRA و Dataset Curation

۹ ساعت

تفاوت SFT، DPO و RLHF و کِی کدام را انتخاب کنیم
LoRA و QLoRA — ریاضیات و trade-off حافظه/کیفیت
Dataset curation — کیفیت بر کمیت، deduplication، filtering
Training با Unsloth و axolotl روی یک GPU
Merge، quantize و آماده‌سازی برای serving

Lab عملی:Fine-tune یک مدل ۷B فارسی با QLoRA روی dataset سفارشی

هفته ۶

Evaluation — LLM-as-Judge، Golden Sets و Regression Testing

۸ ساعت

چرا eval سخت‌ترین بخش LLM engineering است
ساخت golden set و معیارهای کیفیت
LLM-as-judge — pairwise، rubric-based، bias mitigation
Eval framework با Promptfoo و Braintrust
اتصال eval به CI و جلوگیری از regression

Lab عملی:ساخت eval suite کامل با ۱۰۰ سؤال طلایی برای RAG هفته‌ی ۴

هفته ۷

Guardrails — Prompt Injection، PII و Hallucination

۷ ساعت

تاکسونومی حملات — prompt injection، jailbreak، data exfiltration
دفاع‌های لایه‌ای — input/output filtering، sandboxing
PII detection و redaction در ورودی و خروجی
Hallucination detection — groundedness و citation checking
Policy enforcement با NeMo Guardrails و Llama Guard

Lab عملی:افزودن لایه‌ی guardrail کامل به RAG و تست با ۳۰ حمله‌ی شناخته‌شده

هفته ۸

Agents — Function Calling، Tools و Multi-step Planning

۸ ساعت

تفاوت chain، agent و workflow
Function calling — schema design و error handling
Tool use با MCP و استانداردسازی tools
Planning، reflection و self-correction
LangGraph — state machine برای agentهای پایدار

Lab عملی:ساخت agent با ۴ tool (SQL، web search، calculator، RAG) با LangGraph

هفته ۹

Production — vLLM، TensorRT-LLM، Caching و Observability

۸ ساعت

Serving با vLLM و paged attention
TensorRT-LLM — quantization و کاهش latency
Semantic cache و prompt cache برای کاهش هزینه
Routing بین مدل‌های مختلف بر اساس پیچیدگی
Observability کامل با Langfuse — trace، cost، quality

Lab عملی:Deploy یک مدل ۷B fine-tuned با vLLM پشت Nginx با Langfuse integration

هفته ۱۰

Capstone — Production RAG با Eval و Monitoring

۵ ساعت

طراحی معماری end-to-end برای یک use case واقعی
ادغام همه‌ی لایه‌ها — RAG، guardrail، eval، monitoring
Load testing و capacity planning
Cost report و SLO تعریف
ارائه‌ی نهایی و code review توسط مدرسین

Lab عملی:تحویل پروژه‌ی capstone با README، eval report و demo زنده

Hands-on Projects

پروژه‌هایی که در رزومه‌تان می‌نشینند

هر پروژه با code review توسط مربی، در پایان به یک portfolio repository خصوصی شما اضافه می‌شود — برای نشان دادن به کارفرما.

#01

RAG چندنوع داده — PDF، SQL، API

ساخت یک سیستم RAG که هم‌زمان روی مجموعه‌ای از PDFهای فارسی، یک دیتابیس PostgreSQL با schema پیچیده، و یک REST API خارجی کار می‌کند. سیستم باید بتواند منبع پاسخ را تشخیص دهد، query را به مسیر درست route کند و پاسخ نهایی را با citation تحویل دهد.

RAGHybrid RetrievalRoutingCitationPersian Embeddings

#02

Agent با چند Tool و Planning

ساخت یک agent با LangGraph که حداقل چهار tool دارد (SQL query، web search، file system، calculator) و می‌تواند task چندمرحله‌ای را planning کند، خطاها را تشخیص دهد و reflection داشته باشد. agent باید با MCP استاندارد شود و قابل استفاده در Claude Desktop باشد.

LangGraphFunction CallingMCPPlanningTool Use

#03

Fine-tune مدل ۷B برای دامنه‌ی خاص

انتخاب یک دامنه (حقوقی، پزشکی، فنی یا مالی)، curation یک dataset با کیفیت بالا، fine-tune یک مدل ۷B با QLoRA، quantization و serving با vLLM. تحویل شامل eval report کامل با مقایسه‌ی baseline و مدل fine-tuned است.

QLoRADataset CurationvLLMEvaluationQuantization

Authority — Meet Your Instructors

مدرس‌های دوره

مر

مهندس رضا استادی

بنیان‌گذار آکادمی GITA و مدرس مهندسی LLM

مهندس رضا استادی بنیان‌گذار آکادمی GITA و مدرس این دوره است. او با بیش از ۱۵ سال تجربه‌ی عملی در طراحی سامانه‌های مبتنی بر LLM و RAG در مقیاس Production، تیم‌های فنی متعددی را در سازمان‌های بزرگ کشور راهبری کرده و تمرکز او بر انتقال تجربه‌ی واقعی میدانی به زبان ساده و کاربردی است.

بنیان‌گذار و مدیر آکادمی GITAبیش از ۱۵ سال تجربه‌ی مهندسی و راهبری تیم‌های فنیمشاور و مدرس سازمانی در صنایع بانکی، تلکام و انرژیسخنران و مدرس ده‌ها کارگاه و دوره‌ی تخصصی

CERTIFICATE OF COMPLETION

LLM Eng

صادره از آکادمی گیتی‌افروز

Recognition

گواهینامه‌ی قابل ارائه به کارفرما

در پایان دوره گواهینامه‌ای صادر می‌شود که با QR قابل تأیید بوده و به Linkedin، رزومه و پورتفولیو شما اضافه می‌شود.

تأییدشده توسط شورای صنفی AI Engineers ایران

قابل ارائه به کارفرمایان داخلی و بین‌المللی

شامل لینک verifiable و QR code برای راستی‌آزمایی

Social Proof

از دانشجویان بوت‌کمپ‌های قبلی

“

بعد از این دوره تونستم در شرکتمون یک RAG واقعی روی ۲۰۰ هزار سند فارسی بسازم که تیم حقوقی روزانه ازش استفاده می‌کنه. تفاوت با تجربه‌ی قبلیم با LangChain ساده زمین تا آسمونه.

نیما محمدی

Senior ML Engineer در یک fintech · Cohort بهار ۱۴۰۵

“

بخش fine-tuning و QLoRA دقیقاً همون چیزی بود که دنبالش بودم. تونستم یک مدل ۷B رو روی یک RTX 4090 fine-tune کنم و در production استفاده کنم. هزینه‌ی API رو ۷۰٪ کاهش دادیم.

سارا کریمی

AI Lead در یک scale-up سلامت · Cohort زمستان ۱۴۰۴

“

تأکید دوره روی eval و guardrail چیزی بود که هیچ‌جای دیگه به این عمق ندیدم. حالا قبل از هر deploy یک eval suite کامل داریم و regression رو سریع تشخیص میدیم.

علی حسینی

Tech Lead AI در یک e-commerce · Cohort پاییز ۱۴۰۴

“

مدرسین واقعاً production زده بودن، نه فقط tutorial دیده باشن. هر سؤالی می‌پرسیدیم با مثال واقعی از یک سیستم در مقیاس جواب می‌دادن. لب‌ها هم به‌شدت چالشی بود.

زهرا اکبری

Data Scientist در یک بانک · Cohort بهار ۱۴۰۵

“

بخش Persian embedding tuning برای من که روی محصول فارسی کار می‌کنم طلا بود. کیفیت retrievalمون با تکنیک‌هایی که یاد گرفتم سه برابر شد.

محمد طاهری

Backend Engineer در یک LegalTech · Cohort زمستان ۱۴۰۴

“

Capstone واقعاً یک پروژه‌ی قابل ارائه به کارفرما بود. الان توی portfolioم گذاشتم و توی دو مصاحبه کمکم کرد آفر بگیرم.

پویا صادقی

ML Engineer (تازه ارتقا یافته به Senior) · Cohort پاییز ۱۴۰۴

Reserve Your Seat

پیش‌ثبت‌نام بوت‌کمپ

پیش‌ثبت‌نام بدون پرداخت — پس از مصاحبه‌ی ورودی نهایی می‌شود.

Cohort پاییز ۱۴۰۵ — ظرفیت محدود

پیش‌ثبت‌نامبدون پرداخت

شهریه‌ی دوره پس از مصاحبه‌ی ورودی و نهایی‌شدن بوت‌کمپ به‌صورت اختصاصی اعلام می‌شود.

همه‌ی ویدئوها به‌صورت دائمی

Slack اختصاصی بوت‌کمپ

Office hours هفتگی با مربی

Code review پروژه‌ها

گواهینامه‌ی رسمی + Linkedin

معرفی به شرکت‌های همکار برای استخدام

پیش‌ثبت‌نام رایگان — صندلی‌ام را نگه دار

بدون پرداخت در این مرحله. تیم ما طی ۲۴ ساعت برای مصاحبه‌ی ورودی تماس می‌گیرد.

پلن سازمانی

بسته‌ی سازمانی برای ۳ نفر به بالا با ۲۰٪ تخفیف و فاکتور رسمی

درخواست پیشنهاد

Objection Handling

سؤال‌های متداول

01آیا بدون GPU شخصی می‌توانم در دوره شرکت کنم؟

بله. برای لب‌های fine-tuning و serving، اعتبار رایگان روی Runpod و Vast.ai در اختیار شما قرار می‌گیرد. برای مابقی لب‌ها یک GPU متوسط در colab pro کافی است.

02تفاوت این دوره با دوره‌های LangChain و LlamaIndex چیست؟

تمرکز این دوره روی مهندسی و production است نه روی یک framework خاص. ما از LangGraph، Promptfoo، Langfuse و vLLM استفاده می‌کنیم اما اصول را طوری آموزش می‌دهیم که با هر framework دیگری هم قابل اعمال باشد.

03آیا روی مدل‌های closed source مثل GPT و Claude هم کار می‌کنیم؟

بله. در بخش prompt engineering، agentها و guardrail با هر دو خانواده‌ی open و closed کار می‌کنیم. در fine-tuning و serving طبیعتاً تمرکز روی open-source است.

04زبان دوره فارسی است اما منابع چطور؟

تدریس و پشتیبانی کاملاً فارسی است. اسلایدها bilingual هستند و منابع تکمیلی (مقالات و مستندات) عمدتاً انگلیسی‌اند. توانایی خواندن متن فنی انگلیسی الزامی است.

05اگر یک جلسه را از دست بدهم چه می‌شود؟

تمام جلسات ضبط می‌شوند و تا ۱۲ ماه در دسترس شما هستند. علاوه بر آن یک office hour هفتگی برای جبران و رفع اشکال وجود دارد.

06آیا گواهی پایان دوره معتبر است؟

گواهی شامل QR code و لینک verifiable است و توسط کارفرمایان داخلی پذیرفته می‌شود. برای کارفرمای خارجی، نمونه‌ی پروژه‌ی capstone و repo شخصی شما معمولاً وزن بیشتری دارد که در دوره به آن می‌پردازیم.

07تخفیف دانشجویی یا سازمانی دارید؟

بله. ۲۰٪ تخفیف دانشجویی با ارائه‌ی کارت دانشجویی معتبر، و ۲۰٪ تخفیف سازمانی برای ۳ نفر به بالا با فاکتور رسمی.

08اگر بعد از دوره سؤال یا چالش جدید داشتم چه؟

تا ۶ ماه پس از پایان دوره به یک کانال اختصاصی دسترسی دارید و یک جلسه‌ی mentorship ۴۵ دقیقه‌ای رایگان با یکی از مدرسین می‌توانید رزرو کنید.

09آیا امکان بازگشت وجه وجود دارد؟

تا قبل از شروع هفته‌ی دوم، ۸۰٪ مبلغ قابل بازگشت است. پس از آن به دلیل ماهیت cohort-based دوره، بازگشت وجه ممکن نیست اما می‌توانید جای خود را به cohort بعدی منتقل کنید.

10آیا این دوره برای founder غیرفنی مناسب است؟

خیر. این دوره فنی و عملی است و پیش‌نیاز Python پیشرفته و آشنایی با ML الزامی است. برای founderها دوره‌ی جداگانه‌ای با عنوان «استراتژی محصول AI» داریم.

11آیا روی مدل‌های فارسی خاص (مثل Aya و Maral) هم کار می‌کنیم؟

بله. در هفته‌های ۳ و ۵ به‌طور خاص با Aya-23، Maral و فاینال‌سازی روی BGE-fa کار می‌کنیم و کیفیت آنها را روی benchmark فارسی مقایسه می‌کنیم.

12بعد از دوره چه مسیرهای شغلی باز می‌شود؟

خروجی‌های دوره‌های قبلی در نقش‌هایی مثل LLM Engineer، AI Solutions Architect، MLOps for LLMs و Founding AI Engineer در استارتاپ‌های ایرانی و خارجی مشغول به کار شده‌اند. یک جلسه‌ی career coaching هم در پایان دوره داریم.

پیش‌ثبت‌نام در ۶۰ ثانیه

فقط نام و راه ارتباطی — تیم ما طی ۲۴ ساعت با شما تماس می‌گیرد، مصاحبه‌ی ورودی می‌گذارد و در صورت تطابق صندلی برایتان نگه می‌داریم.

بدون پرداخت در این مرحله

معرفی به شرکت‌های همکار برای استخدام پس از دوره

سند Syllabus PDF رایگان

شروع بوت‌کمپ

۲۰ مرداد ۱۴۰۵ · 9 صندلی

ثبت‌نام

GITA OS v3

سیستم‌های سازمانی

هوش مصنوعی و پلتفرم داده

زیرساخت و Cloud Native

امنیت سایبری

Vertical Solutions

نفت، گاز و پتروشیمی

انرژی، آب و یوتیلیتی

بهداشت، درمان و سلامت

HSE، امنیت OT و انطباق

Field Engineering

مشاوره استراتژیک و معماری

پیاده‌سازی و یکپارچه‌سازی

عملیات، SRE و Managed Services

آموزش، ممیزی و انطباق

LLM Engineering — از RAG و Fine-tuning تا Production

دستاوردهای پایان دوره

ده هفته از مفاهیم پایه تا یک سیستم LLM در production

پروژه‌هایی که در رزومه‌تان می‌نشینند

RAG چندنوع داده — PDF، SQL، API

Agent با چند Tool و Planning

Fine-tune مدل ۷B برای دامنه‌ی خاص

مدرس‌های دوره

مهندس رضا استادی

گواهینامه‌ی قابل ارائه به کارفرما

از دانشجویان بوت‌کمپ‌های قبلی

پیش‌ثبت‌نام بوت‌کمپ

سؤال‌های متداول

پیش‌ثبت‌نام در ۶۰ ثانیه