RETRIEVAL_AUGMENTED_KNOWLEDGE
База знаний
Единая RAG-система над корпоративными знаниями RCAI: задачи Redmine, Wiki.js и документы индексируются в векторную БД и доступны через чат с цитированием источников. Помнит контекст проектов, инфраструктуры и истории решений.
Wiki.js
~303
страницы индексированы
Redmine
issues
задачи + журналы проектов
Vector DB
Qdrant
collection knowledge_base
Интерфейс
Chat
с цитатами источников
02
Архитектура
ETL → embed → retrieve → answerSOURCES
Redmine · Wiki · Docs
PG-зеркала, GraphQL, файлы
ETL
Извлечение + чанкинг
нормализация, метаданные
EMBED
Векторизация
эмбеддинги → Qdrant
RETRIEVE
Семантический поиск
top-k + реранк
ANSWER
LLM + цитаты
ответ со ссылками
03
Возможности
⌕
Семантический поиск
Запрос на естественном языке находит релевантные фрагменты по смыслу, а не по ключевым словам.
❝
Цитирование
Каждый ответ ссылается на конкретные страницы Wiki / задачи Redmine — проверяемо.
⟳
Авто-обновление
ETL-конвейер регулярно подтягивает свежие данные из зеркал в векторную БД.
⚙
Мониторинг ETL
Отдельная панель состояния пайплайна (etl.pavelvlasov.tech, под basic-auth).
🗂
Память проектов
Хранит контекст инфраструктуры, решений и истории — не приходится объяснять заново.
⚡
Streamlit-чат
Лёгкий веб-интерфейс с историей диалога и выбором источников.
04
Подключённые источники
| Источник | Что индексируется | Доступ |
|---|---|---|
| Redmine | Задачи, журналы, вложения проекта SmartSky OPT | PG-зеркало |
| Wiki.js | ~303 страницы: SRS, методики, инфраструктура | GraphQL |
| Qdrant | Векторное хранилище эмбеддингов | localhost:6333 |
| Документы | AFM/FCOM/QRH, переписка, спецификации | files |