Честная оценка состояния системы + план развития по 7 направлениям. Приоритет — не новые фичи, а первые реальные данные.
out/paper_portfolio.json → "closed": [] — live-форвард ПУСТ. Equity 490.14 из стартовых 500, 4 позиции в воздухе, unrealized −$9.86. Статистической мощности — ноль.
Новости в симуляции недоступны (sim_briefs.py:120-121). On-chain отсутствует. Funding захардкожен в 0.0. То есть +21% — это LLM на ценe + Fear&Greed. Главный заявленный край в этой цифре не участвовал вообще. Использовать +21% как валидацию новостного слоя — самообман.
Система готова НАЧАТЬ собирать честные данные, но пока не собрала ни одного. Приоритет №1 — не новые фичи, а запуск чистого live-форварда + закрытие 3 тривиальных дыр, которые искажают вход. Всё остальное — после первых реальных закрытых сделок.
Рендер OI в MD-бриф (1 строка кода). Stale-гейт если бриф старше 3ч — 3-5 строк. Алерт на absent-аналитика. Персистентный дедуп новостей (TTL 6ч). Запуск форварда на demo.
Каждая новость → JSON-объект с {timestamp, source, coins, sentiment[-1..+1], confidence}. Вес источника по надёжности. Decay-вес по свежести (4-6ч период полураспада для крипто). Cosine-фильтр дублей. Санитизация от adversarial-атак (скрытый текст в новостях: 65-99% успеха по arxiv 2601.13082).
Доказательство края: LLM-сентимент бьёт словарный FinBERT — 86.7% vs 84.3% точности (arxiv 2412.19245). Мульти-агентный ресёрч (arxiv 2501.00826): новостной агент гасит риск / задаёт направление.
Фаза 2: CryptoPanic Pro ~$29/мес (panic-score + теги монет) · Perception.to $149/мес бета до 15.07.2026 (Bloomberg/Reuters/SEC — то чего нет в RSS)
Ловить не первый спайк (его берут боты за секунды), а вторую волну — устойчивый нарратив, подхваченный 3+ независимыми инфлюенсерами за 24ч и СМИ. Это горизонт LLM-края: 1-5 дней.
Данные по Маску: 67 твитов → значимый эффект только на DOGE, первый пик 3-45 мин — недостижим для LLM-цикла. Эффект твитов Маска затухает год от года.
Без жёсткого фильтра (3+ независимых KOL, объём текста, дедуп) соц-поток засорит контекст. Не лезть сюда пока новости (B) не структурированы.
Live-ликвидации — прямой сигнал каскада. Cross-sectional ротация: BTC-доминация −16% за 6 недель → ETH +72% к BTC (лето 2025). Cross-sectional моментум превосходит time-series в крипто (ResearchGate 2023). CVD/orderflow: дивергенция цена↑/CVD↓ = слабый памп. GEX (опционы) — нишевый, только BTC/ETH перед экспирацией.
Ликвидации ~20 строк, полдня · Cross-sectional 1 день · CVD 3-4 дня · GEX фаза 2
Adversarial Bull/Bear дебаты — 2 агента форсированно аргументируют противоположные стороны → фасилитатор синтезирует. TradingAgents (UCLA/MIT, arxiv 2412.20138): мульти-агент с дебатами — 53.87% годовых, Sharpe 1.702 vs buy-and-hold 26.08%.
Детерминированный State Store — открытые позиции вне LLM-контекста. Убивает галлюцинацию позиций (фантомный портфель — самый опасный production-баг).
3-уровневая память + рефлексия после каждой сделки + принудительный инжект проигрышных кейсов (без принудительных проигрышей similarity-retrieval достаёт только выигрыши → агент самоуверен на плохих сетапах).
Текущий цикл ~$0.07/цикл (~$25/мес 24/7). С дебатами+памятью → ~$40-55/мес. Контролировать промпт-кэшированием.
Форвард копит минимум 30-50 закрытых live-сделок до любых выводов (сейчас 0). Точечный ретро-тест новостного слоя: sim С новостями vs БЕЗ — измерить вклад именно новостного канала. Метрики по режиму×стороне на live, не на sim.
Почему срочно: FinMem +23% бэктест → −22% на форварде. Наш +21% — ровно эта ловушка в зачаточном виде (TradeTrap, arxiv 2512.02261).
Уже есть: базовый цикл 2ч + fast-path риск-сторож 2 мин. Добавить event-trigger: значимая новость инвалидирует кэш брифа и запускает внеплановый LLM-цикл без ожидания следующих 2ч. В крипто новость может развернуть рынок за минуты.
Event-trigger без структурированных новостей может частить на ложных breaking news → лишние дорогие LLM-циклы. Преждевременно.
| Направление | Рычаг | Стоимость | Трудозатраты |
|---|---|---|---|
| A. Гигиена + форвард | ВЫСОКИЙ | $0 | 1-2 дня |
| B. Механика новостей | ВЫСОКИЙ | $0–178/мес | 2-3 дня фаза 1 |
| C. Соц-сентимент | СРЕДНИЙ | $0–149/мес | 1 день MVP |
| D. Ликвидации / cross-sec. | ВЫСОКИЙ* | $0–29/мес | 0.5–4 дня |
| E. Дебаты + state + память | ВЫСОКИЙ | $0–30/мес доп. | Дни – 4 нед. |
| F. Валидация (форвард-протокол) | ВЫСОКИЙ | $0 | Нед. накопления |
| G. Event-driven пайплайн | СРЕДНИЙ | $0–50/мес | Неделя |
* D: ВЫСОКИЙ для ликвидаций + cross-sectional · СРЕДНИЙ для CVD/orderflow · НИЗКИЙ для опционов/GEX
Принцип: сначала перестать врать себе измерением → улучшать сигнал → расширять источники → дорогая архитектура. Дешёвое и фундаментальное вперёд.
| # | Что | Направления | Горизонт |
|---|---|---|---|
| 0 | Гигиена данных — OI в бриф, stale-гейт, absent-алерт, дедуп новостей | A | Часы |
| 1 | Запуск чистого live-форварда — полный бриф (новости + on-chain), идёт ФОНОМ | A + F | Тот же день → недели |
| 2 | Детерминированный State Store — портфель вне LLM-контекста, убивает галлюцинацию позиций | E | Дни |
| 3 | Структура + санитизация новостей — JSON-формат, веса, decay, защита от adversarial | B фаза 1 | 2-3 дня |
| 4 | Ликвидации + cross-sectional — Bybit /v5/market/liquidation + CoinGecko dominance, бесплатно | D приоритет 1-2 | 1-2 дня |
| 5 | Bull/Bear дебаты — заменить одиночного главу деска адверсариальным циклом | E | Неделя |
| 6 | Ретро-тест новостного слоя — sim с новостями vs без, измерить вклад новостей | F | 3-5 дней |
| 7 | Платные источники по результатам форварда — CryptoPanic $29, сентимент, Coinglass, Perception | B/C/D фаза 2 | Фаза 2 |
| 8 | 3-уровневая память + рефлексия + event-trigger — дорого и сложно, только когда форвард доказал что система работает | E / G | Фаза 2 |
Направления A и F. Четыре аргумента:
"closed": [] — ноль реальных закрытых сделок. Любая новая фича сейчас — это улучшение системы, которую мы не умеем измерять.Закрыть 4 дыры из направления A: OI-рендер, stale-гейт, absent-алерт, дедуп. Убедиться что live-цикл пишет полный бриф с новостями+on-chain в paper-портфель, и оставить крутиться. Параллельно — структура новостей (Шаг 3), потому что это усиливает то, что форвард будет измерять.
Не платить за X / Perception / Coinglass. Не строить 3-уровневую память. Не лезть в соц-сентимент. Всё это — после того, как чистый форвард покажет, что базовая система вообще работает. Иначе оптимизируем вслепую.
+21% нельзя считать валидацией новостного слоя — sim шёл без новостей, без on-chain, funding захардкожен в 0.0. Это результат LLM на цене + Fear&Greed.
Риск look-ahead в симуляции — модель Claude обучена до 2025, sim-данные 2026. Механика баров корректна (closed-bar), но веса модели могли «помнить» агрегированные события 2026.
Дебаты из литературы (TradingAgents: 53.87% годовых) — это бэктест. Относиться скептически: FinMem +23% бэктест → −22% на форварде.
Статистика по режиму×стороне (62% win / +$83.6 и т.п.) построена на 52 sim-сделках, не на живых. Статмощности нет.
Минимум для выводов: 30-50 закрытых live-сделок. Делать выводы по 5-10 сделкам — статистически бессмысленно.